Pesquisar neste blog

27 de abr. de 2012

Sentiment Analysis: a nova corrida do ouro da informação digital

Por: Walter Lima
Em: http://cio.uol.com.br/opiniao/2012/04/05/sentiment-analysis-a-nova-corrida-do-ouro-da-informacao-digital/


Algumas das mais importantes organizações de mídia, como The Washington Post, Yahoo, Time e ABC News, estão investindo em tecnologias que podem resultar na construção de um túnel que levará à mina de ouro na camada profunda do tratamento da informação digital: extração do “sentimento” das multidões. Estes grupos investem em pesquisa tecnológica e apostam que vão descobrir o veio que garantirá a dianteira, e sobrevivência, nessa nova corrida do ouro da informação.

É uma área de exploração imensa, pois a interação de muitos indivíduos através das redes sociais conectadas gera enorme e variada quantidade de dados (texto, áudio, imagens estáticas, vídeo etc). Minerando os dados inseridos nas redes sociais, o “sentimento” das multidões pode ser detectado e torna-se uma das mais ricas fronteiras entre a computação e as ciências sociais.

Utilizando técnicas cada vez mais aprimoradas, essas tecnologias tentam “perceber” o que a multidão (milhares de pessoas) está pensando sobre um determinando tema ou fato.

Com o propósito de “captar o sentimento” no meio da conversação nas redes, sistemas que reconhecem linguagem (textmining) e tecnologias com inteligência artificial vasculham semanticamente os posts inseridos pelos usuários. São os computadores e softwares tentando entender o significado da linguagem humana contida nos bytes.

Para isso, utilizam máquinas computacionais que mastigam dados e mais dados (mining), rodando programas que analisam milhões de palavras contidas em mensagens nas redes sociais. Mas esses sistemas conseguem mesmo extrair “sentimentos” de uma massa de usuários de uma rede social conectada?

Exemplos

Um momento propício para observar essas tecnologias já está acontecendo. Com o aquecimento da campanha eleitoral nos EUA, alguns sistemas tentam sinalizar o que a conversação nas redes sociais está dizendo de forma macro sobre os pré-candidatos à presidência. Entre eles estão: o Mentio Machine, do The Washington Post; The Signal, do Yahoo; Campaign Buzz Meter, da Time e rede de TV ABC.

Outra frente explorada com o uso destas traquitanas, levemente semânticas, está na produção der sistemas que estreitam a proximidade do veículo com o seu público-alvo. O Los Angeles Times monitorou os fãs do Oscar e The Boston Globe tenta “pescar” o sentimento dos fãs do time de Beisebol da cidade, o Red Sox.

Laboratório de Pesquisa é a chave

Mas essas tecnologias caem do céu? É só juntar profissionais (conteúdo e tecnologia) e executar um plano de marketing pré-estabelecido? Basta contratar serviços de especialistas em mídias sociais e tudo estará resolvido? Tirando a primeira alternativa, que é ridícula, as duas seguintes são campeãs no Brasil.

Nadando na cultura que a lógica do mercado não combina com os procedimentos descobertos através de pesquisa científica, empresas de mídia no Brasil vão aprofundando o gap entre o que é elaborado nos EUA, Europa e parte da Ásia, no que tange a produção de conteúdo com adição de tecnologias inteligentes. No próximo artigo, tratarei da temática sobre laboratórios de pesquisa dentro das empresas de mídia.

Cito com exemplo da joint-venture entre mercado e academia o caso do Oscar Senti-meter, ferramenta desenvolvida pelo L.A. Times, a IBM e o Laboratório de Inovação da Annenberg da University of Southern California. A tecnologia analisou opiniões compartilhadas no Twitter sobre a corrida ao Oscar, tendo como meta as categorias de melhor ator, atriz e fotografia. O Senti-meter combinou o alto volume de tweets diários, utilizando tecnologia de reconhecimento de linguagem e inteligência artificial, dando como saída (visualização de dados), o “sentimento” de positivo, negativo e neutro.

Tenho muitas perguntas sobre esses sistemas, principalmente, porque os seus algoritmos não são produzidos em código aberto e disponibilizados para serem verificados. Assim, não há como certificar se realmente os resultados demonstrados expressam cientificamente o “sentimento” captado nos tweets.

Esse ponto é extremamente importante no aspecto da democracia, pois nas eleições para presidente do Brasil, há dois anos, um grande portal noticioso brasileiro colocou em sua capa uma visualização desse tipo, mencionando o “sentimento” de positivo ou negativo dos dois principais concorrentes. Tentei verificar qual a metodologia e a tecnologia utilizadas navegando pelos links descobri, bem escondido, que a empresa fornecedora de tal dispositivo não se responsabilizava pelos sentimentos ali visualizados.

Como as visualizações de “sentimentos” podem influenciar o pensamento do eleitor em algum momento, acredito que o Tribunal Superior Eleitoral (TSE) deveria, nas próximas eleições, ficar atendo e verificar as metodologias e tecnologias de mineração de “sentimentos”, a partir de grande quantidade de dados gerados por redes sociais.

Entretanto, essas complexas tecnologias sinalizam que o gargalo do grande volume de dados gerados pela multidão na conversação em redes sociais só pode ser atacado pela joint-venture empresa de mídia e laboratórios de pesquisa, as outras opções não servem nem como estepe remendado.


(*) Walter Lima é pós-doutor Tecnologia e Comunicação. Docente do Programa de Pós-graduação da Universidade Metodista de São Paulo. Membro titular do Núcleo de Ciência Cognitiva da USP.

Nenhum comentário:

Postar um comentário