Assim como a análise hierárquica descendente, a CHA (Classificação Hierárquica Ascendente) é um método de análise estatística usado para agrupar objetos ou indivíduos semelhantes com base em características diferentes.
Esta análise permite identificar e criar, a partir de variáveis selecionadas, grupos de indivíduos, de forma a comparar características comuns dentro de uma mesma família ou de um mesmo grupo.
Realizar uma classificação também permite estabelecer tipologias, por exemplo, para determinar perfis de clientes com comportamentos adequados a eles.
Em nossa série de três artigos dedicados a análises tipológicas, apresentamos neste artigo a classificação hierárquica ascendente.
Agrupamento hierárquico ascendente, ou CHA, é um método de agrupamento que agrupa progressivamente indivíduos ou observações por similaridades. Ao contrário do método K-means, o CHA não exige a especificação antecipada do número de clusters (=grupos) que se deseja obter. Em vez disso, essa abordagem permite a criação de uma estrutura de arborescência hierárquica que ilustra observações que podem ser agrupadas.
O CHA começa considerando um indivíduo como uma classe distinta e, então, mescla progressivamente as classes mais semelhantes até que se tenha apenas uma classe abrangendo todo o conjunto de dados. Essa estruturação hierárquica dos dados é representada graficamente na forma de um dendrograma, que mostra os agrupamentos sucessivos e seu grau de similaridade.
O processo de agrupamento de unidades é realizado gradualmente, passo a passo, priorizando a cada passo as unidades com maior similaridade. Esse agrupamento ocorre com base na distância medida entre dois indivíduos (principalmente no início), entre dois grupos de indivíduos ou entre um grupo e um indivíduo isolado.
O processo é interrompido quando ao adicionar um novo agrupamento ele não melhora a capacidade discriminatória da análise. Permite também definir a melhor hierarquia final, bem como as tipologias resultantes, identificando as categorias ou grupos mais relevantes.
A CHA é, portanto, particularmente útil para visualizar relacionamentos entre grupos e identificar clusters naturais em dados complexos. É comumente usado em setores onde a análise exploratória aprofundada é importante, como marketing, onde ajuda a descobrir segmentos de clientes.
Para interpretar os resultados de uma CHA, vários elementos devem ser analisados.
Por fim, o CHA é ideal para análises exploratórias nas quais buscamos visualizar agrupamentos naturais. Este método de análise é recomendado quando o número de clusters é desconhecido ou para pequenos conjuntos de dados, pois é limitado no número de observações processadas. Ele se distingue por sua abordagem hierárquica, oferecendo flexibilidade para analisar diferentes níveis de agrupamento, mas pode perder eficiência em grandes conjuntos de dados.
Texto traduzido e adaptado de:
https://www.lesphinx-developpement.fr/blog/typologies-des-repondants-la-classification-hierarchique-ascendante/