Robô jornalista já pode estar roubando empregos

Em breve um post como esse pode estar sendo escrito por uma máquina. Não muito em breve, espero. Aliás, como você pode ter certeza que esse ...

Em breve um post como esse pode estar sendo escrito por uma máquina. Não muito em breve, espero. Aliás, como você pode ter certeza que esse texto já não foi escrito por eu, robô? Syntax error...General failure...Error 502
Robô-escritor do filme A Invenção de hugo Cabret (Hugo)

Alan Turing já havia proposto um teste para determinar se uma máquina era realmente "inteligente". Em sua proposta original, um juiz conversaria com um ser humano e uma máquina por um canal que só mostrasse texto (um monitor e um teclado, por exemplo). Se o juiz não conseguisse determinar, com certeza, quem era a máquina e quem era o ser humano, a máquina teria passado no teste.

Mas como determinar se um texto jornalístico foi escrito por um jornalista humano ou por um programa de computador? Bem, a princípio um texto informativo básico (não uma reportagem mais analítica) baseado em fontes que alimentem o programa com dados brutos sendo recheado com frases padronizadas, alguns clichês e um pouco de jargão jornalístico jogado aleatoriamente de forma a não repetir termos e sorteando outros para manter uma aparência de espontaneidade é perfeitamente possível de ser feito e já está sendo empregado em certas áreas, como o jornalismo esportivo, por exemplo.

Algumas das maiores publicações dos EUA publicaram matérias nas últimas semanas sobre uma empresa que desenvolveu um sistema para gerar um texto jornalístico de forma automática. É mais uma pressão a ser sentida pela classe que a cada dia sentem mais e mais as lasquinhas que são tiradas da profissão que sofreu com a investida dos blogueiros (tamo junto e misturado), da tecnologia que deixou a informação cada vez mais rápida e abundante (exigindo um ritmo de apuração e coleta de material como não se teve notícia na história), das próprias redações que andam enxugando os quadros no mundo todo e também pode-se dizer da pirataria.

Ainda que, por outro lado, as pessoas estão lendo mais e demandando mais informação tempestiva. Ainda que cada vez menos dispostas a pagarem muito por ela.

Assim, essa novidade não poderia chegar em pior hora. Mas chegou. Trata-se de programa que combina mineração de dados brutos e estatísticas e relaciona com informações retiradas de fontes pré-estabelecidas (como algumas mídias sociais, por exemplo) e fornece uma nota já formatada para ser lida com toda a informação objetiva e bem-estruturada.

É o que pode ser conferido no blog sobre finanças publicado pela Forbes usando a tecnologia da Narrative Science. Empresa criada por professores da Northwestern University de Nova York e que desenvolve a ferramenta há mais de dez anos.

Esse tipo de iniciativa não chega a ser propriamente uma novidade. Versões semelhantes de apoio aos jornalistas e repórteres já são utilizadas pelas redações da grande mídia na produção de textos editoriais. É o caso da Globo.com que em parceria com o Departamento de Informática da PUC-Rio, vem lançando mão, há mais de um ano, da chamada Web Semântica. Usando palavras cujo significado são entendidos pelos coletores automatizados é possível saber quantos chutes a gol determinada equipe deu com base no número de chutes que cada jogador daquela equipe individualmente desferiu à meta adversária.

Por exemplo, se eu quiser o total de chutes a gol de um time, os dados já embutem a semântica que basta contar os chutes dos jogadores do time, pois ele “entende” que um jogador pertence a um time, e quem faz chute é jogador, não o time. Os indicadores da ocorrência de um estereótipo são definidos em termos de papéis descritos no modelo semântico. Por exemplo: jogador de ataque, jogador de defesa, etc. Os estereótipos de jogo terminam expressos por conjuntos de queries [pesquisas].
Professor Daniel Schwabe. Coordenador do projeto na PUC-Rio

Mas o que se vê agora não é mais o uso de desses apuradores automáticos como ferramenta de apoio, é gerado o próprio texto que antes seria produzido por um jornalista/blogueiro. Enfim, por um ser humano. Em abril desse ano, o repórter Ben Welsh do Los Angeles Times, revelou que faz três anos que ele próprio vem automatizando a produção de matérias. Ou seja, um jornal de grande circulação revelando que publica matérias escritas por computador. E não está sozinho.

Acontece que nos EUA, órgãos de governo divulgam digitalmente dados públicos com uma abrangência muito maior do que o praticado aqui no Brasil (apesar do discurso de transparência estar ganhando corpo). Assim, o Departamento de Polícia de Los Angeles, LAPD, ao raiar do dia envia uma listagem com todas prisões feitas no dia (e na noite) anterior em meio digital para jornais e cidadãos interessados.

Um programa simples, escrito por Ben, abre e lê diariamente a planilha Excel enviada pelo LAPD e joga em tabelas em um banco de dados. Após a coleta analisa os dados. Como se trata de uma cidade de celebridades (Como diria Licinha Lins: Hollywood está ali) o programa procura precipuamente se há algum artista entre os capturados (Nada vende mais jornal do que escancarar os delitos de uma personalidade pública). Após a diversão (brincadeirinha, o programa nem liga), ele compara também a natureza dos crimes, estatísticas relevantes, etc. Aquilo que um experiente jornalista policial investigaria e que a aplicação de Ben é capaz de executar em segundos.

Depois, o resultado dessa análise é convertido em texto de acordo com alguns modelos: "Ontem às X horas se deu o crime Y, a ocorrência foi registrada por Z". Bem esperto, não é?

Alguns desses textos são distribuídos para outros repórteres policiais, outros servem de base para reportagens mais aprofundadas, mas alguns são publicados diretamente, sem maiores apurações. Como aqueles bloquinhos de registro de informação rápida. Bem no estilo "programação de cinema".


Usando outro software, a Forbes publica um blog sobre dados colhidos das empresas com ações em bolsa com texto gerado automaticamente. Leia um trecho de um post típico e julgue você mesmo:

Limited Brands (LTD) reporta seus ganhos do primeiro trimestre na quarta-feira, 16 maio, 2012.

O que esperar:
Os analistas estão projetando ganhos de 40 centavos por ação, combinando esse número a partir de um ano atrás. (...)
Um ano depois de ter sido 2,22 bilhões de dólares, analistas esperam que a receita caia 3,5% em relação ao ano até 2,14 bilhões dólares no trimestre. Para o ano, a receita deverá rolar em 10,32 bilhões dólares.(...)

Tendências a serem observados:

O declínio no lucro líquido no quarto trimestre do ano fiscal passado tirou uma série de três trimestre de lucro crescente. O lucro caiu 20,8% ano-sobre-ano no trimestre mais recente. Indo mais fundo, o número subiu 54,1% no terceiro trimestre do ano fiscal passado, 29,8% no segundo trimestre do ano fiscal passado e 46% no primeiro trimestre do ano fiscal passado.(...)

Limited Brands é um varejista de roupas íntimas e outros produto de beleza, cuidados pessoais e acessórios femininos. Algumas das suas marcas incluem Victorias Secret, Bath, Pink & Body Works e Henri Bendel. A empresa foi fundada em 1963 e está sediada em Columbus, Ohio.


A Forbes, como outros 30 clientes, usa o serviço da Narrative Science (NS). A empresa recebeu 6 milhões de dólares de investimento só esse ano. Além da análise financeira, a NS também publica matérias esportivas e políticas.


O serviço da Narrative Science é largamente empregado em eventos que não são cobertos normalmente por jornalistas. As Little Leagues de beisebol, onde centenas de milhares de crianças competem, é um bom exemplo. Os pais dos pequenos jogadores alimentam as estatísticas em uma app para registro, que é depois aproveitado pelos robôs-jornalistas.

A própria NS estima que 1,5 milhão de partidas este ano terão a cobertura artificial, que custarão menos de 10 dólares para uma reportagem de 500 palavras.


Kristian Hammond, CTO e cofundador da Narrative Science, dá outro exemplo dessa forma de criação de textos em seu blog. Como vemos nesse trecho sobre os pré-candidatos republicanos à corrida presidencial nos EUA:

Newt Gingrich teve o maior aumento na quantidade de tuítes sobre ele hoje. A atividade associada ao candidato no Twitter deu um salto desde ontem, com a maioria dos usuários tuitando sobre impostos e questões de caráter. Newt Gingrich tem sido consistentemente popular no Twitter, e foi quem mais cresceu no site nos últimos quatro dias. O número de tuítes sobre Ron Paul, ao contrário, caiu nas últimas 24 horas. Outro que perdeu tráfego foi Rick Santorum, que tem tido queda constante no número de tuítes a seu respeito.


Boa parte dos que defendem a tecnologia, minimizam o risco de aumento significativo de desemprego no setor dizendo que os profissionais estarão mais livres para fazerem reportagem que exijam análises mais aprofundadas.

Mas Hammond vai além. Diz que nos próximos 5 anos um texto produzido por autômatos provavelmente ganhará o Pullitzer.

Em setembro do ano passado um texto foi produzidos em menos de um minuto pelo serviço da NS no final da terceira parte de um jogo de futebol americano:

O Wisconsin parece estar embalado para a vitória, uma vez que vence por 51-10 na terceira parte contra a UNLV, esta quinta-feira, no Estádio Camp Randall.

Foi um feito notável. Mas nem todos ficaram felizes. O jornalista Charles Walsh, numa coluna do ctpost.com com o título "Nenhum computador vai bater-me na corrida ao Pulitzer" reclamou:

Hey, impostor, quando um time está à frente por 41 pontos na terceira parte do jogo não 'parece' estar embalado.
Esse tipo de sistema especialista parece ser uma tendência. Ainda mais com a crise por que passam os jornais e revistas tendo que se reinventarem diante do desafio imposto pela tecnologia. De qualquer forma a caixa de Pandora está aberta e os jornalistas podem começar a questionar: Será a NS o Deep Blue da classe jornalística?

Fonte:
Narrative Science, IDGNowO GloboGizmodo, RTP, Forbes

[Via BBA]

Comentários

Nome

A divulgar Abelha acessibilidade acessório Acidente Acidentes Acústica Adágios Adestramento Administração adulto Aerodinâmica Aeronáutica África Agência Brasil Agropecuária AIDS Alcoolismo Alemanha Alerta Algoritmo Alimento Alzheimer Amazon Amazônia Análise Combinatória Anatomia Android Animação Animais de Estimação Animal Antropologia apagão Apicultura Apobec App Apple Apresentação aquário Argentina Arqueologia arquitetura Arte Astrobiologia Astronomia Ativismo Áudio Audio FX Áustria Autismo Auto-ajuda Automobilismo Automóvel aventura Aviação Aviônica Bahia Balonismo Banco de Dados Beber e Dirigir biblioteconomia Bicicleta Biografia Biologia Biologia Marinha bioquímica Biotecnologia Blog Blogger Boato Bomba borderô de desconto Botânica Brasil Brasília BRIC Browser Bugs CAD Calor Câmera lenta Campanha câncer cardiologia carreira Casemods Caso Isabella Nardoni Caso Snowden Celebridades celular Células-Tronco Cérebro Charge China Cibercultura Ciclovia Cidadania Ciência Cinema Clip Cliparts Cloud computing Comédia competência Complemento de dois Comportamento Computação Computação em grade Computação forense Computação Gráfica Computação Móvel Comunicação e Marketing Concurso Concurso Cultural de Natal Concursos Público Concursos Públicos Conectômica Conspiração Consumidor Consumismo contabilidade Contos Copa do Mundo Cordel Coreia do Norte Coreia do Sul Corpo Coruja cosmética cosmologia Criança Crime Crime Digital crise crise econômica crônica crônicas Cronologia CSS Cuba Culinária Cultura Curiosidades custos fixo custos variáveis Dança DAO Darwin Decoração demência Demografia Denúncia Dermatologia Desastre Natural Descoberta desconto duplicatas Desenho instrucional Desenvolvimento de jogos Design Dia das Mães Dia do professor diabetes Dica Dicas Didática Dieta diplomacia Direito Direito Eleitoral Direito Internacional Direito Tributário Direitos Humanos Disney Distrito Federal Documentário Doutorado download Drogas e-Book e-governo Ecologia economia Editoração Eletrônica Educação Educação a Distância educação física Educação sexual Efeitos Sonoros Egiptologia Eleições Eleições 2014 Eletricidade eletrônica empreendedorismo enciclopédia endocrinologia Enem Energia Energia Alternativa Energia Nuclear Engenharia Engenharia Civil Engenharia de materiais Engenharia de Software Engenharia Genética Engenharia Mecânica Enretenimento Ensino a Distância Ensino Superior Entomologia Entretenimento Entrevista Epidemiologia Equador Escândalo Escritório Espaço Espanha Espanhol Espeleologia Espetáculo Espionagem Esporte Estação Estágio Estatísticas estrutura de dados Ética EUA Evento Evolução Exercícios físicos Exobiologia experiência fábulas Facebook Farmacologia Favo featured Feminismo Férias Ferramentas FIFA Filantropia Filmes Filosofia Firefox Física Física Quântica Fisiologia Fisioterapia Flagrante Flamengo Folclore Fome Fonoaudiologia Fotografia Fotos em 360 graus França Francês frases Fraude Freeware Futebol Futurologia gadget Gafe Gastroenterologia Gastronomia Geek Genética Geofísica Geografia Geologia Geometria geopolítica Geriatria Gestão de Configuração Gestão de Projetos Gestão do conhecimento Ginecologia Glass Google Governo GPS Gradiente gramática Gravidez Grécia Grécia Antiga Guerra Guinness H2 Haiti hardware História HIV homenagem Horologia HPV HTML Humor Humor Negro IBM ICIJ Idioma IHC ilo ilusão ilusão de óptica ilusão de ótica ilusionismo Imagem 3D Imagens Imagine Cup Império Romano Imprensa Impressora 3D Incêndio Inclusão digital Índia Índios Infectologia Infográfico Informática Inglaterra Inglês Inovação Inteligência Artificial interativo Interface Interface Homem-Computador Interfaces Hápticas Internacional Internacionalização da Amazônia Internet Inundação Invenção Inventos iPad IPEA iphone Irã Iraque Israel Japão Java Java. jogos Jogos educativos Jogos Olímpicos Jornalismo Justiça Kinect Le Monde Diplomatique Brasil Letras Lexicografia Liderança Life Hacking Linguística Literatura Livro Lógica Logística Lua Maçonaria Malásia Malvinas Malware Mapa Mapas Marte Mastologia Matemática Matemática Financeira maternidade Mecânica Mecânica dos Fluidos Mecatrônica Medicina Medicina Esportiva Medicina Veterinária Meio Ambiente Mel melanoma Memória memorização Mente Mercado de Trabalho mercosul Mestrado meteorologia Metodologia Científica México Microbiologia Microsoft Mídia Social Militar Mineralogia Mistério MIT Mitologia Mobilidade Mobilidade Urbana MonaVie Montanhismo Moodle Mossad Motivação MSF Mudança Climática Mulher Multimídia museu Música MVC Nanotecnologia Nasa Natação Natal Natureza Negócios Neurociência Neurologia Nordeste Noruega notícias Novidades Novo Enem Números Nutrição Obama Obesidade Observatório da Imprensa Obstetrícia Oceanografia odontologia Offshore Leaks oftalmologia Olimpíadas oncologia ONU Opinião Óptica Oracle Oriente Médio Orkut Ornitologia ortografia Ortopedia ótica Otorrinolaringologia Paginadores paleontologia Paquistão Pará Paraguai parkinson Passeio virtual Patinação Pediatria Pensamentos performance Periférico Pesca Pesquisa Petição Petrobrás Petróleo Photoshop Pirataria planilha de custo Playstation 3 Plebiscito Pneumologia Podcast Poesia Poítica Política Portugal português Pós-graduação prazo médio Pré-sal Prêmio Nobel primatologia privacidade produtividade professor Hamilton Alves Programa Gratuito Programação Projeto Truco Promoção Propaganda Psicanálise Psicologia Psicologia Animal Psiquiatria Pública publicidade Publieditorial Quadrinhos Quads Qualidade Qualidade de Vida quimica química realidade aumentada realidade diminuída Realidade Virtual Reconhecimento de imagem Reconhecimento de voz Recorde Redação redes Referência Referendo Reforma Política Relacionamento Relações Internacionais Religião Responsabilidade Social Retrospectiva Rio 2016 Rio Grande do Norte Rio Grande do Sul robótica Roda Viva Roma roteiro RSA Rússia Samsung Sanitarismo Santa Catarina São Paulo saúde Savant Segunda Guerra Mundial Segurança Segurança da Informação Seleção Natural serviço Serviço Online Sexologia sexualidade Show SIGGRAPH Simulação Sismologia Sistema operacional Sistemas de Numeração Sites de Busca Sociedade Sociologia Software Software Livre Sol Sono Sony SOPA Suécia Sugestão de presentes Sun supercomputadores Sustentabilidade Tabagismo Talento precoce taxa de juros efetiva taxa de juros nominal Taxas Equivalentes Taxidermia Teatro Técnicas de Estudo Tecnologia Tecnologia da Informação TED TedMed TEDx Rio+20 TEDxAmazônia TEDxAsaSul Telefonia Televisão Temas Tempo Tendências Teologia teoria das supercordas Terremoto Terrorismo Testes Tipologia Tomada de Decisão tradução Trânsito transporte tributo Trigonometria Tubarão Turismo Tutorial Twitter UFG ufologia UFRJ universidade Urbanismo Urologia USP Utilidade Pública Utilitário Vale Vaticano Ventriloquismo Verão vestibular Vestimenta Vida Digital Vida Moderna Vida Selvagem Vídeo Videogame Vídeos Vídeos 360 Violência Vírus Visão Computacional Vôlei Vulcanologia Watergate Política Web 2.0 Web Application Web Semântica Web Seminar webdesign Webinar widget WikiLeaks Wikipedia Windows Xadrez YouTube Zoologia
false
ltr
item
Brasil Acadêmico Draft: Robô jornalista já pode estar roubando empregos
Robô jornalista já pode estar roubando empregos
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgwi-f2BJQxXHx6s1bigqoQQo8Qx2o2WJBz4fiY1CxRTs3Z5EFBkgGoetdE85N9J8-qltQerY2JLHgOep94BmFgtEpHHNybKP1GS5hZ610A-RVmyxOa-B2VgwnEfRkacdY83ltdAGk8xZaZ/s400/hugo-the-automaton.png
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgwi-f2BJQxXHx6s1bigqoQQo8Qx2o2WJBz4fiY1CxRTs3Z5EFBkgGoetdE85N9J8-qltQerY2JLHgOep94BmFgtEpHHNybKP1GS5hZ610A-RVmyxOa-B2VgwnEfRkacdY83ltdAGk8xZaZ/s72-c/hugo-the-automaton.png
Brasil Acadêmico Draft
https://draftbracad.blogspot.com/2012/05/robo-jornalista-ja-pode-estar-roubando.html
https://draftbracad.blogspot.com/
http://draftbracad.blogspot.com/
http://draftbracad.blogspot.com/2012/05/robo-jornalista-ja-pode-estar-roubando.html
true
7742307559183522523
UTF-8
Nenhuma artigo encontrado. VER TODOS Leia mais Responder Cancelar resposta Apagar Por Início PÁGINAS POSTS Ver Todos Indicado para você CATEGORIA ARQUIVO BUSCA TODOS ARTIGOS Nenhum artigo corresponde ao critério procurado Ir para Início Domingo Segunda Terça Quarta Quinta Sexta Sábado Dom Seg Ter Qua Qui Sex Sáb Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez agora 1 minuto atrás $$1$$ minutes ago 1 hora atrás $$1$$ hours ago Ontem $$1$$ days ago $$1$$ weeks ago mais de 5 semanas atrás Seguidores Seguir Este conteúdo é PREMIUM Por favor, compartilhe para liberar Copiar todo o código Selecionar todo o código Todos os códigos foram copiados para o clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy