Popisná slova


Popisná slova

Nápad s motorem pro popisná slova přišel, když jsem stavěl motor pro Související slova (je to jako tezaurus, ale dává vám mnohem širší sada příbuzných slov, než jen synonyma). Při hraní se slovními vektory a rozhraním API „HasProperty“ jsem se trochu pobavil při pokusu získat adjektiva, která slovo běžně popisují. Nakonec jsem si uvědomil, že tam „Je to mnohem lepší způsob, jak to udělat: analyzovat knihy!

Projekt Gutenberg byl původním korpusem, ale analyzátor byl chamtivější a chamtivější a nakonec jsem ho nakrmil někde kolem 100 gigabajtů textových souborů – většinou fikce, včetně mnoha současných děl. Analyzátor jednoduše prohlédne každou knihu a vytáhne různé popisy podstatných jmen.

Doufejme, že je to víc než jen novinka a některým lidem se to skutečně bude hodit pro jejich psaní a brainstorming, ale jedno malé je třeba vyzkoušet porovnat dvě podstatná jména, která jsou si podobná, ale podstatným způsobem se liší – například pohlaví je zajímavé: „žena“ versus „muž“ a „chlapec“ versus „dívka“. Z počáteční rychlé analýzy se zdá, že autoři beletrie alespoň čtyřikrát častěji popisují ženy (na rozdíl od mužů) výrazy souvisejícími s krásou (pokud jde o jejich váhu, rysy a celkovou přitažlivost). Ve skutečnosti je výraz „krásná“ pravděpodobně nejpoužívanějším adjektivem pro ženy veškerá světová literatura, což je docela v souladu s obecným jednodimenzionálním zastoupením žen v mnoha jiných mediálních formách. Pokud to někdo chce podrobněji prozkoumat, dejte mi vědět a mohu vám poskytnout mnohem více údajů (například pro „ženu“ existuje přibližně 25 000 různých záznamů – příliš mnoho na to, aby se zde zobrazovaly).

Modrost výsledků představuje jejich relativní frekvenci. Na položku můžete na sekundu umístit ukazatel myši a skóre frekvence by se mělo objevit. Třídění „jedinečnosti“ je výchozí a díky mému komplikovanému algoritmu ™ je objednává podle adjektiv „jedinečnost konkrétního podstatného jména ve srovnání s jinými podstatnými jmény (je to vlastně docela jednoduché). Jak očekáváte, můžete kliknout na tlačítko „Seřadit podle frekvence použití“ a přidat adjektiva podle jejich frekvence použití pro dané podstatné jméno.

Write a Comment

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *