Descrevendo palavras


Descrevendo palavras

A ideia do mecanismo de palavras descritivas surgiu quando eu estava construindo o mecanismo para palavras relacionadas (é como um dicionário de sinônimos, mas oferece uma conjunto muito mais amplo de palavras relacionadas, em vez de apenas sinônimos). Enquanto brincava com vetores de palavras e a API “HasProperty” do conceptnet, me diverti um pouco tentando obter os adjetivos que comumente descrevem uma palavra. Eventualmente, percebi que havia “uma maneira muito melhor de fazer isso: analisar livros!

O Project Gutenberg foi o corpus inicial, mas o analisador ficou cada vez mais ganancioso e acabei alimentando-o com algo em torno de 100 gigabytes de arquivos de texto – principalmente ficção, incluindo muitas obras contemporâneas. O analisador simplesmente examina cada livro e extrai as várias descrições de substantivos.

Esperançosamente, é mais do que apenas uma novidade e algumas pessoas irão realmente considerá-lo útil para sua escrita e brainstorming, mas um pouco interessante coisa a tentar é comparar dois substantivos que são semelhantes, mas diferentes de alguma forma significativa – por exemplo, gênero é interessante: “mulher” versus “homem” e “menino” versus “menina”. Em uma análise inicial rápida, parece que autores de ficção têm pelo menos 4 vezes mais probabilidade de descrever mulheres (em oposição a homens) com termos relacionados à beleza (em relação ao peso, características e atratividade geral). Na verdade, “bonita” é possivelmente o adjetivo mais usado para mulheres em toda a literatura mundial, que está em linha com a representação unidimensional geral das mulheres em muitas outras formas de mídia. Se alguém quiser fazer mais pesquisas sobre isso, me avise e eu posso lhe dar muito mais dados (por exemplo, há cerca de 25.000 entradas diferentes para “mulher” – muitas para mostrar aqui).

O azul dos resultados representa sua frequência relativa. Você pode passar o mouse sobre um item por um segundo e a pontuação de frequência deve aparecer. A classificação de “exclusividade” é padrão e, graças ao meu Complicated Algorithm ™, ele os ordena pelos adjetivos “exclusividade para aquele substantivo específico em relação a outros substantivos (na verdade, é muito simples). Como era de se esperar, você pode clicar no botão “Classificar por frequência de uso” para acessar os adjetivos pela frequência de uso desse substantivo.

Write a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *