Rodrigues, D. (submited to ECCS’10); The Observatorium — The structure of news: topic monitoring in online media with mutual information
Abstract:Large, real time text classification systems are becoming a popular topic. We present a method for automatically extracting correlated news from online media using a dynamic similarity graph and use the variation of information as a measure to identify topics, lifespan and key terms. The presented method has the advantage of requiring no human intervention or training and having no pre-assigned categories because they emerge from the dynamics of the generated network.
And this is the reason why I’ve been a bit away from blogging lately… Now… next deadline is by March 26 for Open Source Intelligence & Web Mining 2010… and then to Brussels for an ASSYST meeting. It’s going to be a full March…
O primeiro dia da Winter School em Ciências da Complexidade já passou. Estou bastante satisfeito com a turma de alunos que se inscreveram este ano. Bastantes alunos de Doutoramento, quer nacionais quer estrangeiros. Atentos e curiosos. Muito bom! As sessões correram naturalmente. A sessão prática durante a tarde foi mais veloz que pensava (2h correm depressa demais), mas serviu para começar a “meter as mãos na massa” e a mexer nos problemas que afectam o dia a dia dos estudiosos de redes. A próxima sessão deverá ser sobre R, statnet e Pajek na quinta-feira. As sessões plenárias estão a ser gravadas em vídeo (HD Rules baby) e penso que posteriormente estarão disponíveis. Aguardem um pouco.
Este ano não há blog oficial da Winter School como no ano passado, mas em todo o caso foi giro verificar um fenómeno de auto-organização em torno do Google Wave. A turma começou já a utilizar o Wave para tomar notas e apontamentos de forma colectiva. Penso que no futuro este será o tipo de utilização mais interessante, embora um Wave com 20 pessoas se torne um pouco caótico por vezes (algo que a auto-organização corrigirá.)
Amanhã, terça-feira, chegam os restantes speakers e o dia vai ser marcado por sessões do James Sterbenz, do John Symons e do Gergely Palla. Um luxo!
A melhor forma para actualizar a hora, pela hora legal portuguesa, gerida pelo Observatório Astronómico de Lisboa, é utilizar os servidores NTP do OAL:
O céu é talvez a última grande fronteira do homem, quer se goste ou não a verdade é que a espécie humana está condenada a viver num pequeno átomo na imensidão do universo. Isto claro faz o nosso espírito inquieto querer saber o que está mais além. Depois da interessante apresentação do José Afonso nos Encontros da Arrábida acerca do fim da idade das trevas do universo, dei de caras com o site do Grande Telescópio das Canárias (GTC) Um monstro de 10,4 metros de diâmetro e que permitirá “olhar” ainda melhor para o nosso passado.
(podem instalar um destes ao lado do 8″ do meu irmão, sff)
Todos temos as nossas dúvidas quanto à privacidade dos dados que inserimos na internet… mas agora nem os cientistas se salvam… O laboratório nacional de Los Alamos produziu o primeiro mapa da ciência, baseado nos acessos dos cientistas aos sites das publicações de referência.
Tradicionalmente este tipo de mapas era feito a partir das citações, o que levava a algum atraso na visão do estado da ciência. Curiosamente o mapa revela alguns detalhes interessantes, nomeadamente:
Whereas maps based on citations favor the natural sciences, the team’s maps of science showed a prominent and central position for the humanities and social sciences, which, in many places, acted like interdisciplinary bridges connecting various other scientific domains.
Estes estudos são naturalmente de vital importância para perceber o surgimento de novas descobertas científicas.
We apply a series of techniques to James Watson’s genome that in combination reduce it to a mere 4MB, small enough to be sent as an email attachment.
Comprimir dados é uma das tarefas mais rotineiras do nosso dia a dia. No entanto os algoritmos de compressão não são muito eficientes para comprimir o código do genoma humano. Scott Christley, Yiming Lu, Chen Li e Xiaohui Xie escreveram um artigo onde utilizam técnicas avançadas de compressão para conseguir compressões de100:1 permitindo que o genoma humano possa ser enviado como attach de correio electrónico.
O mais extraordinário desta aplicação de compressão é que permite dizer que somos definidos por pouco mais que duas disquetes de 3.5″ ou por metade da capacidade de um iPod nano. Certamente que a ideia de complexidade que temos de nós próprios é definida por muito mais que simplesmente o nosso genoma, mas no entanto não deixa de ser muito estranho.
Não foi à primeira, nem segunda, nem terceira tentativas. Foi à quarta que a SpaceX conseguiu finalmente colocar o Falcon 1 em órbita. O foguetão de combustível líquido foi o primeiro veículo de uma companhia privada a conseguir o feito.
Agora que o falcon 1 atingiu a sua órbita elíptica em torno da terra oscilando entre os 500km e os 700km de altitude pode-se dizer que o futuro da exploração espacial por companhias privadas finalmente começou.
Para todos os que estiverem interessados em Marte e na exploração espacial em geral, podem hoje assistir a partir das 23h à emissão especial da NASATV que vai transmitir em directo a aterragem da Phoenix. Contudo a confirmação do sucesso da missão só deverá vir mais tarde já depois da meia noite. Em todo o caso a melhor forma é acompanhar a emissão de vídeo utilizando a página da NASATV ou então utilizando o link seguinte no QuickTime: http://www.nasa.gov/qtl/151335main_NASA_TV_QT.qtl.
Ainda mais se quiser saber todos os detalhes sobre a Phoenix e sobre o processo de descida o Press Kit da aterragem está muito detalhado e contém muita informação útil.
Atendendo a que 1 em cada 3 tentativas de aterrar em Marte redundaram em fracasso, este é sempre um processo arriscado. Contudo o desafio de explorar um planeta distante faz parte do imaginário humano e ajuda a empurrar a ciência e a técnica mais um passo em frente.
Comentários Recentes