O MyHeritage adiciona uma enorme coleção de diretórios históricos das cidades dos EUA

Comentários2

Temos o prazer de anunciar a publicação de uma enorme coleção de diretórios históricos das cidades dos EUA – um esforço que já dura dois anos. A coleção foi produzida exclusivamente pelo MyHeritage a partir de 25.000 diretórios públicos dos EUA publicados entre 1860 e 1960. Compreende 545 milhões de registros agregados que foram consolidados a partir de 1,3 bilhão de registros, muitos dos quais incluíam entradas semelhantes para o mesmo indivíduo. Essa adição eleva o número total de registros históricos no MyHeritage para 11,9 bilhões de registros.

Pesquise os Diretórios de Cidades dos EUA

A nova coleção de diretórios de cidades no MyHeritage é uma rica fonte de informações para quem deseja aprender mais sobre sua família nos Estados Unidos entre meados do século XIX e meados do século XX. Os diretórios contêm informações valiosas sobre a vida cotidiana americana, desde o período da Guerra Civil até o Movimento dos Direitos Civis.

O que são diretórios municipais?

As cidades dos Estados Unidos produzem e distribuem diretórios desde os anos 1700 como um recurso atualizado para ajudar os residentes a encontrar indivíduos e empresas locais. Os diretórios das cidades geralmente listam nomes (e cônjuges), endereços, ocupações e locais de trabalho. Às vezes, eles incluem informações adicionais.

Exemplo: páginas do Diretório da cidade de Nashville em 1888 (clique para ampliar)

Graças ao seu nível de detalhe, os diretórios das cidades podem fornecer uma alternativa viável aos registros do censo dos EUA durante os anos fora do censo, pois os censos federais são realizados a cada dez anos e, em muitos casos, os diretórios das cidades são publicados anualmente. Eles também podem preencher as lacunas em situações em que os registros do censo foram perdidos ou destruídos. Em 1921, um incêndio no Departamento de Comércio dos EUA destruiu a maioria dos registros do censo de 1890. Apesar da perda dos registros no incêndio, muitos dos dados podem ser reconstruídos usando os diretórios da cidade de 1890 no MyHeritage, que consistem em catálogos de 344 cidades em todo o país, incluindo 88 das 100 cidades mais populosas durante esse ano.

Processamento exclusivo pelo MyHeritage

Os diretórios das cidades nesta coleção foram publicados por milhares de cidades em todo os EUA e cada diretório tem um formato diferente. A enorme quantidade de conteúdo e sua variedade tornaram o projeto mais desafiador e exigiram o desenvolvimento de tecnologia especial para processar os diretórios das cidades.

Primeiro, usamos o reconhecimento óptico de caracteres (OCR) para converter as imagens digitalizadas dos diretórios em texto. Esse processo pode resultar em erros na saída e criamos algoritmos para detectar e corrigir alguns desses erros.

Em seguida, precisamos analisar os registros para identificar os diferentes campos em cada registro: nomes, ocupações, endereços e muito mais. As diferenças de formatação entre os livros apresentaram um desafio adicional. Nossa equipe empregou métodos como NER (Reconhecimento de entidade de nome) e CRF (Campo aleatório condicional) para treinar um algoritmo usando um modelo por livro – o que significa que para cada um dos 25.000 livros, rotulamos manualmente uma amostra dos registros e a usamos para treinar o algoritmo como analisar esse diretório. Usando esse modelo, o algoritmo conseguiu analisar o livro inteiro em um índice estruturado de informações históricas valiosas.

No exemplo abaixo de um registro de diretório de cidade para Ralph McPherran Kiner, jogador e transmissor de beisebol da Major League americana, vemos como nosso sistema superou e corrigiu um erro de OCR. O endereço incorreto no registro de 1957 é 55801 Yorkshire av, enquanto os registros de 1958 e 1960 listam o endereço como h5801 Yorkshire av, e o “h” implica que Ralph é o proprietário. Deduzimos que o primeiro “5” no primeiro registro foi um erro de OCR e, na verdade, deveria ser um “h”, e, portanto, conseguimos determinar que Ralph morava no mesmo endereço durante esses anos.

Exemplo de um registro com um erro de OCR que foi corrigido (clique para ampliar)

Consolidando registros e criando um índice pesquisável

Depois que todas as informações foram analisadas, consolidamos os registros de uma maneira sem precedentes. Identificamos registros que descrevem o mesmo indivíduo que morou em um endereço específico por vários anos, conforme publicado em várias edições dos diretórios da cidade. Em seguida, consolidamos todas essas entradas em um registro agregado que abrange um período de anos. Isso reduziu a “poluição do mecanismo de pesquisa”, em que uma pesquisa por uma pessoa teria retornado várias entradas muito semelhantes de anos sucessivos, ocultando outros registros. A agregação facilita a identificação de mudanças de carreira, datas aproximadas de casamento, novos casamentos e datas de morte plausíveis. Para nosso conhecimento, a dedução algorítmica de eventos de casamento e morte dos diretórios das cidades é exclusiva do MyHeritage.

No exemplo abaixo, consolidamos 31 (!) Registros dos anos de 1912 a 1959 em um único registro. Com base nas informações coletadas ao longo dos anos, é provável que Alfred e Mary Albert tenham se casado por volta de 1914. Também pudemos determinar que Alfred morreu por volta de 1959.

Exemplo de um registro consolidado (clique para ampliar)

O registro agregado também mostra que Alfred mudou de profissão várias vezes durante esses anos, e passou de condutor a carpinteiro a motorista.

Este é o poder da consolidação: ele converte muitos registros “sem graça” em uma única e rica biografia que conta uma história de vida!

Exemplos de problemas desafiadores – e como os resolvemos

Múltiplas entradas

Muitos diretórios de cidades publicados salvaram a digitação (cara) e o papel usando um símbolo para indicar que várias entradas tinham o mesmo sobrenome, como marcas de ponto ou traços. Algumas entradas continuaram na segunda linha, enquanto outras ocupavam apenas uma. O algoritmo precisava entender a diferença entre o texto do sobrenome e o texto que geralmente aparece diretamente abaixo dele.

Por exemplo, no exemplo abaixo, o algoritmo de extração de registro inferiu com êxito que Bartsch é um sobrenome e que a mesma marca na próxima linha também significa Bartsch.

O algoritmo de extração de registro infere sobrenomes de marcas iguais

O algoritmo também determina onde um registro começa e onde termina. Por exemplo, o registro abaixo abrange uma linha:

Esse registro, no entanto, abrange duas linhas:

Se o algoritmo não tivesse inferido isso, teríamos criado um registro adicional para “Waller” e não identificaria como o nome da rua no registro sobre Wm F. Enquanto esse processo funciona muito bem, ainda existem alguns diretórios nos quais este tipo de extração de registro não é 100% robusto.

Abreviações

Uma tabela de abreviações comuns aparece no início de cada diretório da cidade, listando as abreviações de nomes, ocupações, status de residência e endereços usados ao longo do livro. Os registros geralmente são difíceis de decifrar sem o uso das tabelas de abreviação.

Tabela de abreviaturas do diretório da cidade de Jacksonville 1931-1932 (clique para ampliar)

Para integrar as tabelas de abreviação à coleção, inserimos manualmente a tabela em cada livro e a usamos para expandir as abreviações nos registros.

Nosso tratamento das abreviações de primeiro nome nesta coleção é particularmente útil, porque se você estiver procurando por um “Patrick”, o encontraremos para você, mesmo nos registros em que ele estiver listado como “Patk”, para que você não tenha para pensar em todas as formas possíveis de pesquisar por cada nome!

No exemplo a seguir, expandimos as abreviações da ocupação stenographer para estenógrafo, clk para balconista, local de trabalho Fla Natl Bank para Florida National Bank e status de residência “r” para aluguel. Isso melhora a legibilidade e permite pesquisar e corresponder às árvores genealógicas com uma precisão muito maior.

Exemplo de expansão de abreviações em um registro (clique para ampliar)

Informações importantes da coleção

Eventos de vida inferidos

Os registros consolidados do diretório da cidade permitiram ao MyHeritage inferir automaticamente datas de casamento ou morte com base nas alterações nos dados do registro.

No exemplo abaixo, Henry Bennett de Oakland, Califórnia provavelmente se casou no final de 1923 ou no início de 1924, e o Oakland City Directory de 1924 lista Nancy como sua esposa. Criamos, portanto, um evento de casamento com Nancy claramente marcado como implícito, datado de 1924.

Exemplo de data de casamento inferida (clique para ampliar)

No exemplo abaixo, Matthew e Sally Lewin são listados como cônjuges e residem juntos na 305 New Scotland Ave em Albany, Nova York até 1945. Na lista de 1946, Sally aparece como viúva, portanto, deduzimos que Matthew morreu por volta de 1946.

Exemplo de data de óbito inferida (clique para ampliar)

Alteração no status do proprietário

Nos registros, podemos ver se a pessoa que vive em qualquer endereço era um locatário, denotada por um “r” na maioria dos registros, se era pensionista, denotada por “b”, ou se era o proprietário da casa, denotada por um “h”.

Seguindo um registro consolidado ao longo dos anos, pudemos ver se alguém havia mudado de aluguel para proprietário de sua casa no mesmo endereço.

Neste exemplo, vemos que James Thompson era locatário até 1921. Entre 1921 e 1923, ele se tornou o proprietário de sua residência.

Exemplo de alteração no status do proprietário (clique para ampliar)

Exemplo de alteração no status do proprietário (clique para Encontrar outras pessoas que moravam no mesmo endereço)

A coleção de diretórios da cidade permite que os usuários vejam quem mais morou no mesmo endereço. Basta clicar em “Ver quem mais morava neste endereço” na página de registro para executar uma pesquisa por endereço.

Esse recurso pode ser útil para localizar ancestrais, descendentes ou outros membros da família da pessoa que você está pesquisando e que viveu no mesmo endereço em outros períodos. Muitas vezes, várias gerações de uma família viviam no mesmo endereço ou uma casa de família pode ter sido passada de uma geração para a seguinte.

No exemplo a seguir, James e Glenna Japhet moravam na 623 W Olmos Drive, em San Antonio, Texas.

Exemplo de registro de San Antonio, Texas, 1948 (clique para ampliar)

Ao verificar quem mais morava no mesmo endereço nos registros de diretório da cidade, vemos que, além de James e Glenna, outra pessoa com o sobrenome Japhet também é listada nos diretórios como tendo morado naquele endereço: uma mulher chamada Laverne Japhet .

Resultados mostrando outras pessoas que moraram no mesmo endereço (clique para ampliar)

 Parece que Laverne é a segunda esposa de James ou a mesma pessoa que “Glenna L”. Isso abre novos caminhos para mais pesquisas.

Custo

A pesquisa nos diretórios municipais dos EUA é gratuita, mas é necessária uma assinatura para visualizar os registros.

Usuários com uma Assinatura de Dados ou Completa podem visualizar os registros completos, incluindo as imagens digitalizadas em alta resolução dos diretórios originais, confirmar as correspondências dos registros, extrair informações do registro diretamente para as árvores genealógicas e exibir os registros relacionados da pessoa que aparece em um registro histórico que está visualizando no momento.

Resumo

A coleção de Diretórios de Cidades dos EUA no MyHeritage é um tesouro para quem procura mais informações sobre seus antepassados nos Estados Unidos. Trabalhamos muito para preparar esta coleção para nossos usuários e acreditamos que é a coleção de diretórios de cidades online mais inteligente de todos os tempos. Nos próximos meses, planejamos expandir ainda mais essa importante coleção publicando milhares de diretórios de cidades adicionais. Esta adição incluirá diretórios de mais cidades e diretórios publicados antes de 1860 e depois de 1960.

Pesquise o Diretório de Cidades dos EUA agora

Aproveite!

Deixar um comentário

O e-mail será mantido em sigilo e não será mostrado

  • Leise Espirito Santo


    abril 7, 2020

    como faço para coletar o sangue e como enviar e qual o local?

    • Nayara


      abril 8, 2020

      Olá, Leise!

      O teste é feito com a coleta de material genético do interior da sua bochecha, esfregando com um simples cotonete.
      Não fazemos testes sanguíneos 🙂
      Após comprar o kit de DNA online, no nosso site, você receberá na sua casa todo o material necessário para realizar seu teste 🙂