MyHeritage publica novo índice de nomes de jornais históricos dos EUA e do Canadá, com quase um bilhão de nomes

MyHeritage publica novo índice de nomes de jornais históricos dos EUA e do Canadá, com quase um bilhão de nomes

Temos o prazer de anunciar a publicação de uma nova coleção massiva de 982 milhões de nomes, extraídos de nossas coleções de jornais históricos dos EUA e Canadá. 

Os jornais históricos são algumas das fontes mais importantes de informações genealógicas porque são muito ricos em detalhes. Os jornais muitas vezes podem adicionar cor e personalidade aos fatos áridos que muitas vezes são o resultado de outras fontes genealógicas, como registros de censo.

Sobre a coleção

A coleção é um índice de nomes que foram extraídos de coleções de jornais de texto livre existentes nos EUA e Canadá no MyHeritage. O texto livre nessas coleções foi gerado a partir de imagens digitalizadas de jornais usando a tecnologia Reconhecimento Óptico de Caracteres (ROC), que converte imagens em texto.

O novo Índice de nomes de jornais não substitui as coleções de jornais de texto livre, mas é adicionado a elas como uma coleção separada. Além do mais, este índice de nomes é fruto de apenas metade dos nossos jornais, e a outra metade do índice de nomes está sendo gerada e será publicada em breve, de modo que quase um bilhão de registros adicionais serão adicionados em breve.

Os registros no índice incluem o nome de uma pessoa, um trecho de texto que a menciona no jornal e o título da publicação do jornal, data e local de publicação. Cada registro inclui uma imagem digitalizada do artigo de jornal original. Alguns registros também incluirão informações adicionais que podem ser pesquisadas, como o nome do cônjuge e o local de residência, com base nas informações extraídas pelos algoritmos de aprendizagem de máquina. A abrangência do ano e a cobertura do local nesta coleção variam muito.

Pesquise o índice de nomes de jornais no MyHeritage

O novo Índice de Nomes de Jornal tornará muito mais fácil localizar detalhes interessantes sobre seus ancestrais que você pode ter perdido em pesquisas anteriores. Com a adição dessa enorme coleção, agora existem 15,1 bilhões de registros históricos no MyHeritage.

Por que criamos o índice de nomes de jornais

Embora o mesmo conteúdo já existisse em nossas coleções de jornais, ele estava anteriormente em formato de texto livre, o que significava que a capacidade de pesquisa era mais limitada. Se você estivesse procurando por um ancestral com o primeiro nome de William, não teria encontrado artigos de jornal onde seu ancestral fosse mencionado como Bill ou Willie. E teria retornado artigos irrelevantes sobre pessoas com o sobrenome William. Seguindo um processo de extração inteligente, que implementamos usando aprendizagem de máquina, o novo índice de nomes é uma coleção estruturada que oferece suporte completo para sinônimos em pesquisas e diferencia entre nomes e sobrenomes. O índice de nomes inclui até relacionamentos entre pessoas e endereços, sempre que estes possam ser extraídos. Por exemplo, um artigo de jornal mencionando “William e Roberta Miller” contribui para os registros de índice estruturados para William Miller e Roberta Miller, que são considerados cônjuges, e podem ser combinados automaticamente com árvores genealógicas usando a tecnologia formidável de correspondência de registros do MyHeritage. Anteriormente, mesmo se você pesquisasse por “William Miller”, poderia ter perdido essa menção porque os nomes “William” e “Miller” estão mais separados no artigo, resultando em uma classificação mais baixa em uma pesquisa de texto livre.

O Índice de Nomes de Jornais emprega o Global Name Translation™ – a tecnologia exclusiva do MyHeritage que traduz automaticamente os nomes entre os idiomas. Isso significa que a pesquisa de nomes em um alfabeto estrangeiro, como hebraico ou cirílico, retornará resultados de pesquisa de jornais em inglês. O MyHeritage foi pioneiro na tecnologia Global Name Translation™ para ajudar os usuários a superar as barreiras do idioma e permitir que eles localizem registros que mencionam seus ancestrais em diferentes idiomas (bem como em variações de um nome em cada idioma). Saiba mais sobre a tecnologia Global Name Translation™ do MyHeritage neste post recente.

Exemplo de registro

O Índice de nomes de jornais contém um registro sobre a lenda da música Johnny Cash. O registro é baseado em breves descrições dos próximos programas de TV encontrados no Sarasota Herald-Tribune de 6 de abril de 1978. A nova peça de Johnny Cash foi ao ar na TV, então o jornal apresentou uma breve descrição dela. Na versão em texto livre da coleção do jornal, você veria apenas o trecho de texto relacionado ao nome de Johnny. O Índice de Nomes de Jornal, em contraste, inclui o nome de Johnny, bem como o nome de sua esposa, June Cash. 

Record on Johnny Cash in the Newspaper Name Index

Registro sobre Johnny Cash no Índice de Nomes de Jornais

Também na coleção está um registro do renomado arquiteto Frank Lloyd Wright. O artigo é sobre uma conferência de corretores de imóveis em que Wright será um dos principais palestrantes. O artigo também faz referência à residência de Wright em Spring Green, Wisconsin, onde a propriedade de sua família estava localizada. O Índice de Nomes de Jornal extrai o nome de Frank Lloyd Wright, bem como seu endereço. Se você estivesse procurando por Frank Lloyd Wright na versão em texto livre das coleções de jornais, veria apenas o trecho relacionado ao nome de Frank e não seu endereço.  

Record on Frank Lloyd Wright in the Newspaper Name Index

Registro sobre Frank Lloyd Wright no índice de nomes de jornais

Resumo

As coleções de jornais são um recurso genealógico incrível, pois contêm detalhes ricos, com formatos que os genealogistas consideram muito úteis, como obituários, anúncios de casamento e avisos de nascimento. As páginas da sociedade e histórias de interesse local contêm informações sobre atividades e eventos na comunidade e geralmente fornecem detalhes sobre as pessoas envolvidas. O novo índice de nomes aprimora os jornais americanos e canadenses do MyHeritage e abre a porta para encontrar detalhes sobre parentes que não foram percebidos no passado ao pesquisar a versão de texto livre dessas coleções. Esperamos que, com este novo índice, você possa encontrar mais facilmente os tesouros da família nos jornais do MyHeritage.

Pesquisar as coleções no MyHeritage é gratuito. Para ver esses registros ou salvá-los em sua árvore genealógica, você precisará de uma Assinatura de Dados ou Completa. Se você tem uma árvore genealógica no MyHeritage, nossa tecnologia Record Matching irá te notificar automaticamente se os registros do índice de nomes e as coleções de jornais de texto livre corresponderem aos seus parentes.

Aproveite a nova coleção!