Como construí uma Máquina do Tempo de Informação

Imaginem que poderiam "surfar" no Facebook da Idade Média. Numa palestra divertida e interessante, o investigador e engenheiro Fré...

Imaginem que poderiam "surfar" no Facebook da Idade Média. Numa palestra divertida e interessante, o investigador e engenheiro Frédéric Kaplan mostra a Máquina do Tempo de Veneza, um projeto que pretende digitalizar 80 km de livros para criar uma simulação histórica e geográfica de Veneza ao longo de 1000 anos.

Esta é uma imagem do planeta Terra. É muito semelhante às fotografias da Apollo, que são muito conhecidas. Há algo diferente; podemos clicar na fotografia, e se clicarmos nela podemos ampliar, praticamente, qualquer lugar na Terra.



Por exemplo, isto é uma visão aérea panorâmica do campus da EPFL. Na maioria dos casos, também podemos ver como um edifício é visto a partir de uma rua adjacente. Isto é impressionante. Mas há algo que falta nesta visita maravilhosa. O tempo. Eu não tenho a certeza de quando esta fotografia foi tirada. Nem sequer tenho a certeza de que foi tirada na mesma altura em que a fotografia aérea foi tirada. No meu laboratório desenvolvemos ferramentas para viajar, não só no espaço, mas também no tempo. O tipo de perguntas que estamos a formular é: "É possível construir algo "como um Google Maps do passado?" "Conseguirei eu adicionar um diapositivo ao Google Maps "e ajustar o ano "e ver como como era 100 anos antes, "1000 anos antes?" "Isso é possível?" "Conseguirei eu reconstruir redes sociais do passado?" "Conseguirei eu criar um Facebook da Idade Média?" "Conseguirei eu construir máquinas do Tempo?" Talvez possamos simplesmente dizer: "Não, não é possível." Ou talvez possamos pensar nisso sob uma perspectiva de informação. Isto é o que eu chamo de cogumelo da informação. Na vertical, tem o tempo. Na horizontal, a quantidade de informação digital disponível. Obviamente, nos últimos 10 anos temos muita informação disponível. E obviamente, quanto mais regredimos no passado, menos informação temos. Se queremos construir algo como o Gogle Maps do passado, ou o Facebook do passado, precisamos de alargar este espaço, precisamos de tornar isto num rectângulo. Como fazemos isso? Uma maneira é através da digitalização. Há montes de material disponível — jornais, livros impressos, milhares de livros impressos. Posso digitalizá-los todos. Posso extrair informação de todos. É claro, quanto mais regredimos no passado, menos informação vamos ter. Mas pode não ser suficiente. Então, posso fazer o que os historiadores fazem. Posso extrapolar. Isto é o que nós chamamos, em ciências de computação, simulação. Se eu pegar num diário de bordo, posso considerar que não é apenas um diário de bordo de um capitão veneziano numa viagem específica. Posso considerar que é, na realidade, um diário de bordo que representa muitas viagens daquele período. Estou a extrapolar. Se eu tenho um quadro de uma fachada, Posso considerar que não é apenas desse edifício em particular, mas que provavelmente partilha da mesma gramática da forma dos edifícios de que perdemos informação.

Por isso, se queremos construir uma máquina do tempo, precisamos de duas coisas. Precisamos de arquivos enormes e precisamos de especialistas excelentes. A Máquina do Tempo de Veneza, o projecto sobre o qual vos vou falar, é um projecto em parceria entre a EPFL e a Universidade de Veneza Ca'Foscari

Há algo de muito peculiar sobre Veneza é que a sua administração tem sido muito, muito burocrática. Eles têm mantido registos de tudo, quase como o Google hoje em dia. No Arquivo do Estado (Archivio di Stato) há 80 kilómetros de arquivos a documentar todos os aspectos da vida de Veneza por mais de 1000 anos. Está lá cada barco que saiu, cada barco que entrou. Estão lá todas as alterações que foram feitas na cidade. Está tudo lá. Estamos a preparar um plano de digitalização de 10 anos que tem o objectivo de transformar este arquivo imenso num sistema de informação gigante. O tipo de objectivo que queremos alcançar é que sejam digitalizados 450 livros por dia. É claro que quando digitalizamos, isso não é suficiente. porque estes documentos, a maioria deles estão em latim, toscano, num dialecto veneziano e é preciso transcrevê-los, traduzi-los, e em alguns casos, indexá-los e isto, obviamente, não é fácil. Especificamente, o método de reconhecimento óptico de carácteres que pode ser aplicado a manuscritos impressos, não funciona bem com documentos escritos à mão. Por isso, a solução é ir buscar inspiração a outro domínio: reconhecimento de voz. Isto é um domínio de algo que parece impossível, que na realidade pode ser feito simplesmente, acrescentando algumas restrições. Se tiverem um modelo muito bom de uma linguagem que é usada, se tiverem um modelo muito bom de um documento, de quão bem eles estão estruturados. E estes são documentos administrativos. Em muitos casos eles estão bem estruturados. Se dividirmos este arquivo enorme em sub-conjuntos mais pequenos, onde cada sub-conjunto partilha características similares, então temos hipótese de sermos bem sucedidos.

Se alcançarmos esse estado, depois, há mais outra coisa: Conseguimos extrair eventos destes documentos. Provavelmente, 10 biliões de eventos podem ser extraídos deste arquivo. E este sistema de informação gigante pode ser pesquisado de muitas formas Se fizermos uma pergunta como: "Quem viveu neste palazzo em 1323?" "Quanto custava um pargo no mercado Realto "em 1434?" "Qual era o salário "de um vidreiro em Murano "ao longo de uma década?" Podemos fazer perguntas ainda maiores porque está codificado semanticamente. E depois, o que podemos fazer é colocar isso em termos de espaço, porque muita desta informação é espacial. E, a partir daí, podemos fazer coisas como reconstruir a viagem extraordinária desta cidade que conseguiu ter um desenvolvimento sustentável ao longo de mil anos, conseguindo sempre um equilíbrio com o seu meio ambiente. Podemos reconstruir essa viagem, visualizá-la de muitas formas diferentes. Mas claro, não conseguimos compreender Veneza só por olharmos para a cidade. Temos que a colocar num contexto europeu mais amplo. Por isso, a ideia é também documentar todas as coisas que funcionavam a um nível europeu. Também conseguimos reconstruir a viagem do império marítimo veneziano, como controlou o Mar Adriático progressivamente, como se tornou o império medieval mais poderoso do seu tempo, controlando a maior parte das rotas marítimas de leste até sul.

Mas podemos fazer ainda outras coisas, porque nestas rotas marítimas, existem padrões regulares. Podemos ir um passo mais além e criar um sistema de simulação, criar um simulador mediterrânico que seja capaz de reconstruir mesmo a informação que nos falta, que nos possibilite fazer perguntas como se estivéssemos a utilizar um planeador de percursos.

"Se eu estou em Corfu em Junho de 1323 "e quiser ir para Constantinopla, "onde posso apanhar um barco?"

Provavelmente, podemos responder a esta questão com um ou dois ou três dias de precisão.

"Quanto custará?"

"Quais são as hipóteses de encontrar piratas?"

É claro, compreendemos que o principal desafio científico de um projecto como este é qualificar, quantificar e representar a incerteza e inconsistência a cada passo deste processo. Há erros em todo o lado, erros nos documentos, é o nome errado do capitão, alguns barcos nunca chegaram a zarpar. Há erros na tradução, interpretações parciais, e em cima de tudo isso, se adicionarmos os processos algorítmicos, vamos ter erros no reconhecimento, erros na extracção, por isso temos informação muito, muito incerta.

Então como podemos detectar e corrigir estas inconsistências? Como podemos representar essa forma de incerteza? É difícil. Uma coisa que podemos fazer é documentar cada etapa do processo, não só codificando a informação histórica mas também o que chamamos de meta-informação histórica, como o conhecimento histórico é construído, documentando cada etapa. Isto não garante que vamos convergir para uma única história de Veneza, mas, provavelmente, podemos reconstruir uma potencial história de Veneza totalmente documentada. Talvez não haja um único mapa. Talvez haja vários mapas. O sistema deve permitir isso, porque temos de lidar com uma nova forma de incerteza, que é mesmo nova para este tipo de base de dados gigantes.

E como deveremos comunicar esta nova pesquisa a uma vasta audiência? Novamente, Veneza é extraordinária para isso. Como os milhões de visitantes que a visitam todos os anos, é na realidade, um dos melhores lugares para tentar inventar o museu do futuro. Imaginem, horizontalmente, vemos o mapa reconstruido de um certo ano, e verticalmente, vemos o documento que serviu de base para a reconstrução, quadros, por exemplo. Imaginem um sistema imersivo que permita ir e imergir e reconstruir a Veneza de um certo ano, é uma experiência que podemos partilhar em grupo. Pelo contrário, imaginem que, na realidade, começamos com um documento, um manuscrito veneziano, e que vocês mostram o que pode ser reconstruído a partir dele, como é descodificado, como o contexto desse documento pode ser recriado. Esta é uma imagem de uma exposição que é actualmente feita em Geneva com este tipo de sistema.

Para concluir, podemos dizer que a pesquisa nas humanidades está prestes a submeter-se a uma evolução que, na realidade, é semelhante ao que aconteceu às ciências da vida há cerca de 30 anos atrás. É mesmo uma questão de escala. Vemos projectos que estão muito além do que uma equipa de investigação pode fazer e isto é realmente novo para as humanidades, que muitas vezes adquirem o hábito de trabalhar em pequenos grupos ou apenas com um par de investigadores. Quando visitamos o Archivio di Stato, sentimos que está além do que qualquer equipa individual pode fazer, e que deve ser um esforço comum e partilhado. Por isso, o que devemos fazer para esta mudança de paradigma é fomentar uma nova geração de "humanistas digitais" que vão estar prontos para esta mudança.

Muito obrigado.

(Aplausos)

[Via BBA]

Comentários

Nome

A divulgar Abelha acessibilidade acessório Acidente Acidentes Acústica Adágios Adestramento Administração adulto Aerodinâmica Aeronáutica África Agência Brasil Agropecuária AIDS Alcoolismo Alemanha Alerta Algoritmo Alimento Alzheimer Amazon Amazônia Análise Combinatória Anatomia Android Animação Animais de Estimação Animal Antropologia apagão Apicultura Apobec App Apple Apresentação aquário Argentina Arqueologia arquitetura Arte Astrobiologia Astronomia Ativismo Áudio Audio FX Áustria Autismo Auto-ajuda Automobilismo Automóvel aventura Aviação Aviônica Bahia Balonismo Banco de Dados Beber e Dirigir biblioteconomia Bicicleta Biografia Biologia Biologia Marinha bioquímica Biotecnologia Blog Blogger Boato Bomba borderô de desconto Botânica Brasil Brasília BRIC Browser Bugs CAD Calor Câmera lenta Campanha câncer cardiologia carreira Casemods Caso Isabella Nardoni Caso Snowden Celebridades celular Células-Tronco Cérebro Charge China Cibercultura Ciclovia Cidadania Ciência Cinema Clip Cliparts Cloud computing Comédia competência Complemento de dois Comportamento Computação Computação em grade Computação forense Computação Gráfica Computação Móvel Comunicação e Marketing Concurso Concurso Cultural de Natal Concursos Público Concursos Públicos Conectômica Conspiração Consumidor Consumismo contabilidade Contos Copa do Mundo Cordel Coreia do Norte Coreia do Sul Corpo Coruja cosmética cosmologia Criança Crime Crime Digital crise crise econômica crônica crônicas Cronologia CSS Cuba Culinária Cultura Curiosidades custos fixo custos variáveis Dança DAO Darwin Decoração demência Demografia Denúncia Dermatologia Desastre Natural Descoberta desconto duplicatas Desenho instrucional Desenvolvimento de jogos Design Dia das Mães Dia do professor diabetes Dica Dicas Didática Dieta diplomacia Direito Direito Eleitoral Direito Internacional Direito Tributário Direitos Humanos Disney Distrito Federal Documentário Doutorado download Drogas e-Book e-governo Ecologia economia Editoração Eletrônica Educação Educação a Distância educação física Educação sexual Efeitos Sonoros Egiptologia Eleições Eleições 2014 Eletricidade eletrônica empreendedorismo enciclopédia endocrinologia Enem Energia Energia Alternativa Energia Nuclear Engenharia Engenharia Civil Engenharia de materiais Engenharia de Software Engenharia Genética Engenharia Mecânica Enretenimento Ensino a Distância Ensino Superior Entomologia Entretenimento Entrevista Epidemiologia Equador Escândalo Escritório Espaço Espanha Espanhol Espeleologia Espetáculo Espionagem Esporte Estação Estágio Estatísticas estrutura de dados Ética EUA Evento Evolução Exercícios físicos Exobiologia experiência fábulas Facebook Farmacologia Favo featured Feminismo Férias Ferramentas FIFA Filantropia Filmes Filosofia Firefox Física Física Quântica Fisiologia Fisioterapia Flagrante Flamengo Folclore Fome Fonoaudiologia Fotografia Fotos em 360 graus França Francês frases Fraude Freeware Futebol Futurologia gadget Gafe Gastroenterologia Gastronomia Geek Genética Geofísica Geografia Geologia Geometria geopolítica Geriatria Gestão de Configuração Gestão de Projetos Gestão do conhecimento Ginecologia Glass Google Governo GPS Gradiente gramática Gravidez Grécia Grécia Antiga Guerra Guinness H2 Haiti hardware História HIV homenagem Horologia HPV HTML Humor Humor Negro IBM ICIJ Idioma IHC ilo ilusão ilusão de óptica ilusão de ótica ilusionismo Imagem 3D Imagens Imagine Cup Império Romano Imprensa Impressora 3D Incêndio Inclusão digital Índia Índios Infectologia Infográfico Informática Inglaterra Inglês Inovação Inteligência Artificial interativo Interface Interface Homem-Computador Interfaces Hápticas Internacional Internacionalização da Amazônia Internet Inundação Invenção Inventos iPad IPEA iphone Irã Iraque Israel Japão Java Java. jogos Jogos educativos Jogos Olímpicos Jornalismo Justiça Kinect Le Monde Diplomatique Brasil Letras Lexicografia Liderança Life Hacking Linguística Literatura Livro Lógica Logística Lua Maçonaria Malásia Malvinas Malware Mapa Mapas Marte Mastologia Matemática Matemática Financeira maternidade Mecânica Mecânica dos Fluidos Mecatrônica Medicina Medicina Esportiva Medicina Veterinária Meio Ambiente Mel melanoma Memória memorização Mente Mercado de Trabalho mercosul Mestrado meteorologia Metodologia Científica México Microbiologia Microsoft Mídia Social Militar Mineralogia Mistério MIT Mitologia Mobilidade Mobilidade Urbana MonaVie Montanhismo Moodle Mossad Motivação MSF Mudança Climática Mulher Multimídia museu Música MVC Nanotecnologia Nasa Natação Natal Natureza Negócios Neurociência Neurologia Nordeste Noruega notícias Novidades Novo Enem Números Nutrição Obama Obesidade Observatório da Imprensa Obstetrícia Oceanografia odontologia Offshore Leaks oftalmologia Olimpíadas oncologia ONU Opinião Óptica Oracle Oriente Médio Orkut Ornitologia ortografia Ortopedia ótica Otorrinolaringologia Paginadores paleontologia Paquistão Pará Paraguai parkinson Passeio virtual Patinação Pediatria Pensamentos performance Periférico Pesca Pesquisa Petição Petrobrás Petróleo Photoshop Pirataria planilha de custo Playstation 3 Plebiscito Pneumologia Podcast Poesia Poítica Política Portugal português Pós-graduação prazo médio Pré-sal Prêmio Nobel primatologia privacidade produtividade professor Hamilton Alves Programa Gratuito Programação Projeto Truco Promoção Propaganda Psicanálise Psicologia Psicologia Animal Psiquiatria Pública publicidade Publieditorial Quadrinhos Quads Qualidade Qualidade de Vida quimica química realidade aumentada realidade diminuída Realidade Virtual Reconhecimento de imagem Reconhecimento de voz Recorde Redação redes Referência Referendo Reforma Política Relacionamento Relações Internacionais Religião Responsabilidade Social Retrospectiva Rio 2016 Rio Grande do Norte Rio Grande do Sul robótica Roda Viva Roma roteiro RSA Rússia Samsung Sanitarismo Santa Catarina São Paulo saúde Savant Segunda Guerra Mundial Segurança Segurança da Informação Seleção Natural serviço Serviço Online Sexologia sexualidade Show SIGGRAPH Simulação Sismologia Sistema operacional Sistemas de Numeração Sites de Busca Sociedade Sociologia Software Software Livre Sol Sono Sony SOPA Suécia Sugestão de presentes Sun supercomputadores Sustentabilidade Tabagismo Talento precoce taxa de juros efetiva taxa de juros nominal Taxas Equivalentes Taxidermia Teatro Técnicas de Estudo Tecnologia Tecnologia da Informação TED TedMed TEDx Rio+20 TEDxAmazônia TEDxAsaSul Telefonia Televisão Temas Tempo Tendências Teologia teoria das supercordas Terremoto Terrorismo Testes Tipologia Tomada de Decisão tradução Trânsito transporte tributo Trigonometria Tubarão Turismo Tutorial Twitter UFG ufologia UFRJ universidade Urbanismo Urologia USP Utilidade Pública Utilitário Vale Vaticano Ventriloquismo Verão vestibular Vestimenta Vida Digital Vida Moderna Vida Selvagem Vídeo Videogame Vídeos Vídeos 360 Violência Vírus Visão Computacional Vôlei Vulcanologia Watergate Política Web 2.0 Web Application Web Semântica Web Seminar webdesign Webinar widget WikiLeaks Wikipedia Windows Xadrez YouTube Zoologia
false
ltr
item
Brasil Acadêmico Draft: Como construí uma Máquina do Tempo de Informação
Como construí uma Máquina do Tempo de Informação
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgyXO1Zx4QNvbgOP0DEC8Z6NjwGGm7gPNGng5_hyPkpoIJEtx7olAsr75CbEOPMmWVFBgvvpzlEnY4q5fo2e7hVPAXHcgjz8qUljGaQTROg6tdqPYrqtdO4tY2iK1qYnXL1gKoutFN2nyI/s400/Kaplan.jpg
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgyXO1Zx4QNvbgOP0DEC8Z6NjwGGm7gPNGng5_hyPkpoIJEtx7olAsr75CbEOPMmWVFBgvvpzlEnY4q5fo2e7hVPAXHcgjz8qUljGaQTROg6tdqPYrqtdO4tY2iK1qYnXL1gKoutFN2nyI/s72-c/Kaplan.jpg
Brasil Acadêmico Draft
http://draftbracad.blogspot.com/2014/03/como-construi-uma-maquina-do-tempo-de.html
http://draftbracad.blogspot.com/
http://draftbracad.blogspot.com/
http://draftbracad.blogspot.com/2014/03/como-construi-uma-maquina-do-tempo-de.html
true
7742307559183522523
UTF-8
Nenhuma artigo encontrado. VER TODOS Leia mais Responder Cancelar resposta Apagar Por Início PÁGINAS POSTS Ver Todos Indicado para você CATEGORIA ARQUIVO BUSCA TODOS ARTIGOS Nenhum artigo corresponde ao critério procurado Ir para Início Domingo Segunda Terça Quarta Quinta Sexta Sábado Dom Seg Ter Qua Qui Sex Sáb Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez agora 1 minuto atrás $$1$$ minutes ago 1 hora atrás $$1$$ hours ago Ontem $$1$$ days ago $$1$$ weeks ago mais de 5 semanas atrás Seguidores Seguir Este conteúdo é PREMIUM Por favor, compartilhe para liberar Copiar todo o código Selecionar todo o código Todos os códigos foram copiados para o clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy