Desculpem lá a falta de prática destas coisas de falar para o microfone… Prometo que não é muito longo.
Podem descarregar “isto” aqui
Desculpem lá a falta de prática destas coisas de falar para o microfone… Prometo que não é muito longo.
Podem descarregar “isto” aqui
Após uma viagem muito divertida atravessando Espanha, finalmente chegamos a Barcelona. Cansados, com um GPS que tinha deixado de cooperar (NDrive nunca mais, onde anda o meu velhinho TomTom?) e indicava uma distância para o Hotel de 34Km, mesmo quando já estávamos dentro do mesmo. Ainda assim, e fugindo a uns pingos de chuva lá fomos até à Rambla para procurar comida (com a nossa sorte ainda teríamos que acabar abrindo uma garrafa de Vinho Verde e o presunto de Salamanca que estavam no carro).
A conferência europeia de sistema complexos (a finalidade para a qual esta viagem foi feita) bateu todas as expectativas. Mais de 1000 participantes estiveram no World Trade Center de Barcelona (porto de abrigo do muitos paquetes e cruzeiros que se realizam no mediterrâneo). O sucesso da conferência para os próximos anos parece assegurada (Lucca em Itália será perfeita) mas torna difícil selecionar com critério o que ver, tantas que são as sessões paralelas. Para além disso o último dia foi mais fraco, até porque muitos (como eu) se fizeram à estrada.
O caminho de volta à ilha levou-me para Norte, por Girona e FIgueres do lado espanhol e por Beziers, Millau (onde atravessei o fantástico viaduto Millau do Norman Foster) para terminar em Clermont-ferrand.
O dia seguinte levou-me ainda mais para norte onde atravessei a mancha no comboio de automóveis (Já viram a beleza que viajou comigo?)
No total de foram mais de 30h a conduzir (13 de Lisboa para Barcelona, 7 de Barcelona para Clermond-ferrand e 12 de Clermond-ferrand para Milton Keynes). No fim desta viagem penso que já não direi mal da Easyjet quando me trouxer de regresso a Lisboa.
DIY kindle scanner from peter purgathofer on Vimeo.
Segundo o relatório para a transparência publicado da EFF (Eletronic Frontier Foundation), Portugal aparece logo em segundo lugar na lista de países que mais pedem a identificação de contas de utilizadores ao Google.
Agora poderíamos pensar à primeira vista que este tipo de situação seria pedida por países de democracias dúbias ou onde a própria palavra democracia seria tabu, mas não. Curiosamente a lista é dominada por países que considerarmos democráticos. O que permite concluir que as Coreias do Norte não precisam de perguntar nada ao Google porque já sabem tudo sobre os seus cidadãos (e não só).
Mais ainda assim continua a dar que pensar porque é que Portugal faz tantos pedidos de identificação de contas ao Google. Será que tem a ver com a nossa natural aversão à crítica e a uma tentativa natural do português de censurar as vozes discordantes (Eu sei que estão a pensar em política)? E depois da identificação? Será que vão proceder à lavagem cerebral?
When plotting the results of community detection on networks, sometimes one is interested in more than the connections between nodes. These network relations are usually multidimensional and you might want to represent other aspects other than the network links between nodes.
Plotting node attributes in R and iGraph might be tricky as the documentation is not always clears. In this example we’ll be using the Davis Dataset from the iGraph repository. This dataset was collected by Davis et al1 in the 1930s and represents the observed attendance at 14 social events by 18 Southern women.
Let’s start by loading network data into R and also load the required igraph library — igraph is a graph manipulation library that makes it very easy to create, load, analyse, and plot graphs in R. I’ve provided many examples of using igraph but one should really invest some time learning igraph for serious networks and graphs analysis.
library(igraph) graph <- nexus.get("Davis") plot(graph) |
It is obvious that the plot of the graph is very bland and it isn’t easy to see any natural graph partition. It would be nice to have clusters of people in different colours and shapes. Let’s try to improve the plot by identifying communities in the graph.
Let’s ignore that this graph is a bipartite graph for now, let’s just try to partition the graph into communities. Is there a natural division? A division of the graph nodes where there are more connections inside the partition than there are connections to other communities? Let’s colour the nodes according to the community they belong:
graph.com <- fastgreedy.community(graph) V(graph)$color <- graph.com$membership + 1 plot(graph) |
To find the communities in the graph, we first use Clauset et al2 greedy algorithm that maximises modularity of the graph in an agglomerative hierarchical clustering. Modularity compares the density of connections inside communities with a null model where connections between graph nodes was random. Then we assign the attribute color according to the graph community membership.
As we see the algorithm found 2 communities and at first inspection the division seams reasonable. In any case remember that there's another natural division that the algorithm couldn't find: the bipartite relation Event / Woman. Each node has this other property that says “Is Woman” or “Is Event”. Let's use that to characterise the graph in a different way. We have 14 Events. For these we'll change their shape.
V(graph)[V(graph)$type == 1]$shape <- "square" V(graph)[V(graph)$type == 0]$shape <- "circle" plot(graph) |
As we can see, we change the look of the graph in R by changing attributes of the nodes or of the edges. Almost every visual aspect can be changed, from the layout of the graph, to the size of the elements of the graph. This examples illustrated the basic mechanisms to change the plotting of graphs to make them more informative.
Allison Davis, Burleigh Bradford Gardner, Mary R. Gardner, Deep south: a social anthropological study of caste and class, University of Chicago Press (1941). ↩
A Clauset, MEJ Newman, C Moore: Finding community structure in very large networks, http://www.arxiv.org/abs/cond-mat/0408187 ↩
Não consigo perceber o porquê de tanta notícia sobre os 4000 ‘lattes’ que o Steve Jobs encomendou na apresentação do iPhone. Parece uma daquelas coisas de fanboys dementes e o surgimento de tantas referências a esse episódio mais ou menos em simultâneo é algo concertado. E o papalvo come e cala. Ou então talvez seja uma forma de fazer relações públicas e manter o nome da Apple nos ditos sites sem haver realmente nada de interessante para falar.
Também não consigo perceber a recente onda de posts sobre o abandono do linux desktop a favor do Mac OS X. Entre os queixosos aparecem o Dave Winer (do RSS) e o Miguel de Icaza (ex-gnome e agora Mono). Entre as coisas que se queixam aparece a necessidade de configurar manualmente as máquinas para conseguir ter aquilo que precisam a funcionar. Curiosamente não tenho que instalar nada manualmente há muito tempo para que o Ubuntu funcione correctamente. Pelo contrário, para ter algumas coisas a funcionar no OS X é preciso andar a fazer uns kung fus com homebrew, macport ou fink, mas pelos visto para eles isso é bem melhor que um apt-get qualquer. Não percebo. Ou percebo, mas não vou entrar em teorias de conspiração.
Há agora uma paranóia ou moda, ou lá o que lhe quisermos chamar, sobre os malefícios de trabalhar sentado e todos parecem andar a construir mesas feitas para trabalhar em pé. Claro que se esquecem de dizer que ao fim de uns dias em pé todos estão é a procurar um médico para operar as varizes. No entanto o conceito não deixa de ser interessante.
O problema é que normalmente não há uma forma fácil de alterar as nossas rotinas e as nossas mesas de trabalho para que possamos estar em pé o dia todo (ou pelos parte dele). No meu caso não posso mexer na altura da mesa do escritório pelo que a única solução foi arranjar um suporte para elevar o teclado bluetooth, o rato e os monitores. Como utilizo dois monitores o segundo ficou um pouco mais baixo do que queria e ainda não arranjei uma solução para ele. Mas adiante.
Uma pessoa só percebe quanta tralha tem quando finalmente decide mudar os livros de casa. São toneladas! Começa-se por encaixotar os ditos. Percebe-se que cada metro de estante acaba por levar uns 30Kg de livros e não se percebe como se conseguiu comprar tanto, tanto livro. Só nestas alturas é que percebemos que estamos já velhos. E claro depois de tudo retirado está na altura de voltar a arrumar os livros novamente nas estantes. Que dor de cabeça.
Muitas vezes tenho escrito alguns posts baseados na análise de alguns dados disponíveis. Foi por exemplo o caso da primeira luta contra a #pl118, ou da análise recente ao estado do cinema português.
A grande vantagem de escrever sobre os dados é que torna-se muito mais difícil opinar sobre um assunto e temos que nos cingir muito mais ao que realmente os dados nos mostram. Isto levou-me muitas vezes a rever as ideias pré-concebidas que tenho sobre determinados assuntos.
Por exemplo, no caso do cinema em Portugal, é claro que assumia que não se fazem filmes, que a crise está a afectar o sector como nunca, que é tudo um pântano. A verdade é que depois de procurar os dados que fundamentassem uma análise, não a encontrei. Os dados mostram que o cinema português produziu nos últimos 3 anos quase 450 filmes, entre ficção, documentários, curtos, etc.
Então os dados deram-me uma chapada e obrigam-me a pensar isto de uma forma diferente. Afinal há uma indústria de cinema que funciona mas que sistematicamente se queixa de um estado de crise permanente? Será isto um maneirismo da subsidio-dependência? São os meus dados robustos? A metodologia é boa?
Por um lado a metodologia pode ter alguns defeitos, os dados podem não ser os mais recentes, ou os mais precisos. Estou a depender do levantamento efectuado por outros, pelo que não conheço a metodologia adoptada. Há imensos aspectos que podem ser colocados em causa num post deste género. Mas até que alguém me apareça com dados novos, que eu possa utilizar e cujos resultados sejam reprodutíveis, tudo não passa de conversa. Os dados só são bons até aparecem dados de melhor qualidade.
Estes artigos baseados em dados acabam sempre por ser um pau de dois bicos. Por um lado servem para esclarecer factos e a afirmações que se ouvem a toda a hora na boca dos megafones públicos e por outro servem para levantar mais questões do que as explicações que apresentam. Acabam por nunca serem taxativos, mas procuram fazer apenas pensar alto um pouco. São uma espécie de brainstorming público. Nada mais.