Dos nossos círculos sociais à classificação de corpos de textos em larga escala.

david-rodrigues-network.jpg

Discovering Social Circles in Ego Networks
by Julian McAuley, Jure Leskovec

Um processo de clustering automático das nossas redes sociais por forma a identificar os círculos sociais a que pertencemos. O método combina análise da estrutura de rede (topologia) com informação dos perfis dos utilizadores. Para cada círculo é criado uma métrica da similaridade dos perfis e os autores mostram que o método é robusto para detectar os círculos nas nossas ego networks do Facebrocasbook, Google+ ou Twitter. Isto faz lembra um pouco o que Linkdn In fez recentemente na web, permitindo mapear os nossos círculos profissionais.

Large-Scale Sparse Principal Component Analysis with Application to Text Data
by Youwei Zhang, Laurent El Ghaoui

PCA é uma técnica que visa reduzir o número de dimensões de um qualquer dataset e que apresenta o inconveniente de por vezes ser difícil perceber qual o significado físico das dimensões encontradas. Este paper no entanto mostra como PCA esparso pode ser utilizado para análise de corpos de textos. O algoritmo promete ainda concorrer com modelos de detecção de tópicos.