Book Matching: alertas de coincidências também com livros!

Comentários29

A semana está apenas começando e vamos iniciá-la com o pé direito, com novidades para vocês! Temos o prazer de anunciar mais uma nova e revolucionária tecnologia no nosso site, a Book Matching.

Esta tecnologia faz uma varredura de todas as nossas coleções de livros históricos já digitalizados e busca pessoas que foram adicionadas às árvores genealógicas de MyHeritage. Esta ferramenta exclusiva do site do MyHeritage faz uma análise semântica para que possa compreender cada linha, de cada página, de cada livro digitalizado, a fim de encontrar coincidências entre os nomes, com grande precisão. A ferramenta já adicionou 80 milhões de novos matches para os nossos usuários! Cada match representa um parágrafo de um livro, que trata especificamente de uma pessoa presente na árvore. É então possível acessar diretamente o parágrafo em questão e fazer buscas no restante do livro.

Com a ferramenta Book Matching você será capaz de fazer descobertas fascinantes sobre a sua família, que não seriam encontradas de outra forma. Quem sabe você não descobre até mesmo novos parentes e antepassados? Use as informações descobertas para aumentar sua família e para dar mais colorido às suas vidas.

Só para contar um pouquinho da nossa história e relembrar nossas conquistas, primeiramente lançamos o SuperSearch™, nosso motor de busca para registros históricos, em 2012. Em dezembro de 2015 nós adicionamos a nossa coleção de livros históricos ao SuperSearch™. Bem recentemente, nós triplicamos o número de livros compilados, aumentando de 150 mil para 450 mil os volumes desta coleção, com um total de 91 milhões de páginas. Para compilar os livros nós formamos um grupo de curadores e já planejamos acrescentar milhões de novas páginas à coleção de livros digitalizados a cada ano.

O desafio

Livros sempre foram uma das melhores fontes de pesquisa genealógica, mas fazer buscas eficientes era quase impossível. Mesmo depois de serem fotografados e digitalizados e de ser aplicada uma técnica de reconhecimento ótico de caracteres (OCR), ainda continuava sendo necessária uma enorme quantidade de tempo para se verificar os livros onde se pensava ter uma fonte importante, quando na verdade, muitas vezes, tratava-se de falsos positivos. Por exemplo, se você tinha um Antônio  Gabriel na sua árvore genealógica, a pesquisa em livros trazia resultados de pessoas com nomes Antônio ou Gabriel, sem levar em consideração primeiros nomes, ou sobrenomes. Mesmo se a busca trouxesse resultados com Antônio Gabriel, isto não era nenhuma garantia de que se tratava ali do Antônio Gabriel procurado. Mas não havia  como fazer buscas cruzadas, procurando por um Antônio Gabriel, nascido em Portugal, na década de 40, casado com uma Maria das Graças Mota.

Book Matching trazendo soluções

A nossa tecnologia de Book Matching ultrapassa estas dificuldades na medida em que é capaz de entender narrativas, descrevendo pessoas em livros históricos, incluindo nomes, datas, eventos, locais e relacionamentos, e encontrando matches de grande precisão, em grande velocidade, para todos os 2 bilhões de indivíduos, presentes nas árvores genealógicas do MyHeritage. E este processo é sempre aumentado na medida em que adicionamos mais livros e vocês mais pessoas à árvore.

Uma tarefa hercúlea com cara de simples

Extrair informações  genealógicas de livros não é uma tarefa fácil. Em documentos estruturados como certidões de nascimento, ou censos demográficos fica claro saber que tipo de informação está contida nos documentos encontrados. É fácil saber onde estão os nomes, as datas de nascimento e assim por diante. Por outro lado, com dados de textos não estruturados, como livros históricos digitalizados, fatos como datas de nascimento, falecimento e locais podem estar escritos de inúmeras maneiras diferentes, com contextos variados, sem uma localização ou ordem claramente delimitada. Embora expressões como “morte”, “morreu”, “faleceu” possam fazer referência à morte de uma pessoa, outras expressões menos usadas também têm que ser levadas em considerações, como “partiu desta para melhor”, “nos deixou” ou “foi levado para junto do Pai”. Atualmente nós temos uma lista muito grande de expressões somente para poder detectar o falecimento de alguém. Os livros muitas vezes não utilizam o nome completo das pessoas. Por exemplo, um parágrafo pode trazer o primeiro nome de uma mulher e o parágrafo seguinte passa a falar e a descrever seu pai. Para detectar e colocar juntas estas informações é necessário o uso de uma tecnologia bastante poderosa e nós trabalhamos duro para desenvolver os mais variados algoritmos possíveis, para podermos garimpar informações genealógicas dentro dos livros. Eles foram testados e aprimorados, repetidos e aperfeiçoados para garantir os níveis mais altos de precisão e para que pudéssemos extrair o maior número de informações possíveis de cada livro. Durante o processo, nós encontramos milhões de pequenos erros em OCR e os corrigimos. Por exemplo, se havia uma informação dizendo que uma pessoa havia nascido em “<aio” nós corrigimos para “Maio”, ou se foi escrito “Avril”, nós entendemos que se queria ter escrito “Abril”, e assim por diante.

No momento, alguns livros estão ainda duplicados, pois eles foram incluídos em sites de domínio público várias vezes, por grupos diferentes. Ninguém havia sido capaz de detectar que isso era redundante. Estamos agora nas últimas fases de otimizar uma tecnologia que seja capaz de “desduplicar” os livros. Ou seja, assim que completarmos esta etapa, estas matches repetidas irão desaparecer.

Book Matching em ação

Recentemente mostramos a alguns dos genealogistas blogueiros mais agraciados (ou geneabloggers, como eles são muitas vezes chamados) as Book Matches que encontramos para eles, de forma que eles fossem os primeiros a ver a tecnologia em ação, nas suas próprias árvores genealógicas.

Dick Eastman, do blog Eastmans´s Online Genealogy Newsletter vem pesquisando há vários anos a história da sua família. Ele tem aproximadamente 2780 pessoas na sua árvore genealógica salva no site do MyHeritage e já recebeu cerca de 500 Book Matches. A maioria das informações dos livros é novidade pra ele.

Por exemplo, Elizabeth Fifield, uma tia de uma antepassada direta de Dick (8ª geração) aparecia em sua árvore genealógica simplesmente com uma data de nascimento, de falecimento e seus irmãos.

Uma Book Match automática foi encontrada para a Elizabeth no livro “Genealogical and personal memoirs relating to the families of the state of Massachusetts [Memórias pessoais e genealógicas relacionadas às famílias do Estado de Massachusetts]; por Cutter, William Richard, 1847-1918”, uma fonte que Dick talvez ainda não tivesse consultado.

O trecho abaixo foi encontrado pelo MyHeritage. Como vocês podem ver, informações muito importantes foram encontradas para ela, como o nome do seu marido e outras informações históricas importantes sobre ele e seus 6 filhos, incluindo suas datas de nascimento – todas estas informações que Dick ainda não tinha e que ele pode agora incluir em sua árvore, adicionando assim um novo ramo à ela.

Outro genealogista de renome, o Randy Seavers do blog Genea-Musings tem mais de 40 mil pessoas na sua árvore no MyHeritage. E agora com mais de 20 mil Book Matches ele tem uma verdadeira montanha de informações novas para analisar. Por exemplo, Randy tem um parente, William Seavers Woods, em sua árvore genealógica que aparentemente nunca foi casado.

No anuário “Alumni Record of Wesleyan University [Registros de formandos da Universidade de Wesleyan], Middletown, Connecticut, 1921” MyHeritage encontrou uma coincidência perfeita para William:

William se formou naquela universidade e a página lista algumas de suas conquistas, mencionando inclusive o nome de sua esposa e de seu filho – informações que Randy ainda não tinha em sua árvore. Note que o filho de William Robert usava o sobrenome da sua mãe Grace: Crombie. Uma vez que Robert não usava nem o sobrenome Seavers, nem Woods, Randy poderia nunca ter descoberto esta informação se não fosse por este Book Match. Agora Randy tem uma pista nova e pode voltar a pesquisar este ramo da família, que parecia ter chegado a um beco sem saída.

Leland Meitzler do blog Genealogy Blog importou sua árvore  genealógica com 5106 membros para o site do MyHeritage. Ele já recebeu alertas sobre 694 Book Matches. Um deles se refere a Elisha Mills, encontrado no livro “A Walloon Family in America: Lockwood de Forest and His Forbears [Uma família de valões na América: Lockwood de Forest e seus ancestrais]1500-1848,” (1914).

A coincidência permite adicionar os pais de Elisha e descreve também todos os seus feitos, adicionando também mais vida à história da família.

Finalmente Pat Richley, do blog Dear Myrtle, também recebeu alguns Book Matches. Thomas Wasden, o trisavô de Pat, era exibido na sua árvore com muito poucas informações, somente datas e locais.

Mas foi encontrada uma coincidência entre ele e o livro “Colonial Families of Philadelphia [Famílias coloniais da Filadélfia] by Jordan, John Woolf, 1840-1921” (1911).

A match também trazia uma foto dele, do século XIX. Um incrível achado que Pat agora pode adicionar à sua árvore!

Os blogueiros ficaram de queixo caído com as incríveis coincidências encontradas, que trouxeram informações únicas e exclusivas às suas respectivas árvores. Não foram encontrados literalmente nenhuns falsos positivos. Se o Book Matching foi capaz de encontrar informações tão preciosas para genealogistas profissionais, que pesquisam suas famílias há tantos anos e com tanto conhecimento de causa, imagina o que a tecnologia não é capaz de fazer para você e para quase todo usuário do MyHeritage…

A compilação das fontes publicadas é uma coleção de livre acesso para todos. Mas para visualizar os Book Matches é necesário ter uma assinatura de dados do MyHeritage.

O que virá a seguir? O Book Matching só está disponível para livros em inglês por enquanto, mas a tecnologia será aprimorada para que livros em outros idiomas também possam ser analisados. Nós estamos sempre aumentando o nosso repositório de registros históricos digitalizados, para facilitar a pesquisa da história familiar. Esperamos firmemente que possamos dobrar o número de livros digitalizados em MyHeritage em breve. E iremos adicionar livros de genealogia extraordinários de toda a Europa, em todas as línguas mais importantes da Europa em breve!

Como saber se você também tem Book Matches? Basta fazer o login no seu site de família e checar se você tem Record Matches através da aba de Descobertas, ou cheque sua caixa de entradas de email, para ver se enviamos um email novo para você. Qualquer Match recebida será possível graças a esta nova tecnologia.

Você ainda não conhece o MyHeritage? Faça o seu cadastro no site e faça o upload da sua árvore genealógica através de um arquivo GEDCOM e comece agora mesmo a se beneficiar das novas descobertas possíveis através do Book Matching – uma ferramenta exclusiva do MyHeritage.

Você ficará espantado com o valor inestimável destes livros históricos e passará a vê-los com muito mais carinho, reconhecendo o seu valor que será trazido a você com a tecnologia do Book Matching.

Divirta-se!

Deixar um comentário

O e-mail será mantido em sigilo e não será mostrado

  • Marcia Goulart


    abril 12, 2016

    Olá gostaria se possível os registro completo da minha árvore Obg

  • Janete


    abril 12, 2016

    E pago? Quanto? E se a descendência e européia e possível fazer a genealogia?

    • Karen


      abril 14, 2016

      Oi Janete, é necessária a assinatura de dados para se acessar todos os matches encontrados para você. Clique em “minhas compras” e “Assinatura de Dados” para conferir quanto ficaria a assinatura para você, dependendo do tempo que gostaria de assinar. Em caso de dúvidas é só entrar em contato com o nosso suporte: support@myheritage.com
      Lembrando que esta assinatura é para se ter acesso a todos os matches encontrados, bem como ao nosso SuperSearch – o nosso motor de busca de registros históricos.

  • Camilo Resende


    abril 12, 2016

    Que bom o Myheritage sempre inovando em tecnologias. Espero que este recurso esteja disponível em Português em breve. Pois meu sonho é fazer um fotolivro de meus familiares e antepassados.
    Um grande abraço

    • Karen


      abril 14, 2016

      Obrigada Camilo!

  • arnaldo


    abril 12, 2016

    UAUUUU uma pena que demore chegar aos ascendentes Portugueses, mas parabéns pela inovação.

  • Wilson Secco


    abril 21, 2016

    O livro é especifico só com os familiares da minha arvore ? e qual seria custo do livro……. quando podemos acessar visitar para conhecer….

    • Karen


      abril 22, 2016

      Não, Wilson. A nossa coleção engloba quase meio milhão de livros internacionais sobre genealogia, mas não é específico da sua família. O acesso é gratuito, basta entrar no seu site de família em http://www.myheritage.com.br e verificar os seus Record Matches.

  • Jorge Purgly


    abril 21, 2016

    Wow

  • Maria Manuela Ferreira dos Santos


    abril 21, 2016

    Interessante , mas quanto se paga?

  • Celeste Correia Saraiva


    abril 22, 2016

    Muito interessante.
    Grata pela informação

  • Heleno Costi


    abril 22, 2016

    Gostaria de ver as informações a respeito da família

  • Heleno Costi


    abril 22, 2016

    Para ver o que tem a respeito dos COSTI

  • Rhaíssa F. M. Sampaio


    abril 22, 2016

    Amei… Tô tentando fazer com que a família entre e insira dados na nossa árvore… Mas eles não perceberam o valor disso ainda. Os dados básicos eu consegui praticamente todos… Mas assim que puder farei essa assinatura… Muito obrigada!

  • Silvia Kuhn Berenguer Barbosa


    abril 22, 2016

    Parabéns pelas inovações!

  • Hugo Magno C. Avelino


    abril 22, 2016

    Tenho assinatura completa do MyHeritage. Uso pouco o sistema. Gostaria de saber se tem como eu cria um livro e imprimir sobre a Historia da minha família pelo MyHeritage?
    +55 0**84 98885-8739.

  • Miriam Soares


    abril 22, 2016

    muito interessante, adoro esse site pena que ainda não posso assina-lo mas assim que puder irei fazer

  • Marcelo Honorio Orsini.


    abril 22, 2016

    Procuro por Antonio Orsini, vindo de Genova / Itália.
    Muito obrigado!

  • humberto mussy


    abril 23, 2016

    hoje é muito importante saber origem pelo nome e sobre nome

  • António Agostinho Lino.


    abril 26, 2016

    Muito Bom Dia.

    Não tenho grande Familia.

    Mas gostava de saber mais sobre os meus Antipassados.

    Muito Obrigado.

    • Karen


      abril 27, 2016

      Olá António, comece por criar a sua árvore genealógica. Confira também no nosso blog as nossas dicas para iniciantes, colocando “começar árvore genealógica” no campo de busca. Boa sorte!

  • Fernando Pacheco


    abril 26, 2016

    Tem custo? Quanto?

  • lucia


    abril 26, 2016

    excelente

  • Candida Sa Dantas


    abril 26, 2016

    As inovações apresentadas parecem-me muito interessantes.Gostava de saber as condições de acesso.
    Será possível enviar-mas?
    Muito obrigada.
    Maria Cândida de Sá Dantas

    • Karen


      abril 27, 2016

      Olá Cândida, basta acessar seu site de família e clicar em Record Matches. Se o sistema já tiver encontrado um Book Match para você, você poderá então acessá-lo.

  • António Agostinho Lino.


    maio 26, 2016

    Muito Agradecido.

    Mas tenho um problema ? Como corrigir dados de Familiares.
    que estão duplos. ou não correctamente, Escritos na Árvore
    porque eu ainda faço muitos erros. ao adicionar novos Nomes.

    Enquanto não souber trabalhar. Não me posso registar no Premium. Vou tentando aprender mais.

    • Karen


      maio 27, 2016

      Oi António, você já conhece a nossa ajuda online? Lá nós damos respostas para várias perguntas e dúvidas dos nossos usuários, confira: http://helpcenter.myheritage.com.br/

  • luiz julio waltenberg


    junho 10, 2016

    Ainda não usei mas acho que deve ser magnifico.

  • luiz julio waltenberg


    junho 10, 2016

    acho que o book matching deve ser formidável, mas ainda não tive oportunidade de usa-lo. Abraços.