Sanojen kuvaaminen


Sanojen kuvaaminen

Kuvailevien sanojen moottorin idea syntyi, kun rakensin vastaavien sanojen moottoria (se on kuin sanasto, mutta antaa sinulle paljon laajempi joukko samankaltaisia sanoja, eikä vain synonyymejä.) Pelatessani sanavektoreilla ja conceptnetin ”HasProperty” -sovellusliittymällä, minulla oli vähän hauskaa yrittää saada adjektiivit, jotka yleensä kuvaavat sanaa. Lopulta tajusin, että siellä ”on paljon parempi tapa tehdä tämä: jäsentää kirjoja!

Gutenberg-projekti oli alkuperäinen korpus, mutta jäsentäjä tuli ahneimmaksi ja ahneemmaksi, ja päädyin syöttämään sitä noin 100 gigatavuun tekstitiedostoja – enimmäkseen fiktiota, mukaan lukien monet nykyaikaiset teokset. Jäsennys yksinkertaisesti tarkastelee jokaisen kirjan läpi ja vetää esiin erilaisia substantiivien kuvauksia.

Toivottavasti se on enemmän kuin vain uutuus, ja joillekin ihmisille on todellakin hyödyllistä kirjoittaa ja ideoida, mutta yksi siisti pieni kokeiltavaa on verrata kahta samankaltaista, mutta jollain merkittävällä tavalla erilaista substantiivia – esimerkiksi sukupuoli on mielenkiintoinen: ”nainen” vs. ”mies” ja ”poika” vs. ”tyttö”. Alkuperäisen nopean analyysin perusteella näyttää siltä, että kaunokirjallisuuden kirjoittajat kuvaavat ainakin neljä kertaa todennäköisemmin naisia (toisin kuin miehet) kauneuteen liittyvillä termeillä (heidän painonsa, ominaisuuksiensa ja yleisen houkuttelevuutensa suhteen). Itse asiassa ”kaunis” on mahdollisesti yleisimmin käytetty adjektiivi naisille koko maailman kirjallisuus, joka on melko linjassa naisten yleisen yksiulotteisen edustuksen kanssa monissa muissa tiedotusvälineissä. Jos joku haluaa tehdä lisätutkimuksia tästä, ilmoita siitä minulle ja voin antaa sinulle paljon enemmän tietoja (esimerkiksi ”nainen” on noin 25000 erilaista merkintää – liian monta näytettäväksi täällä). > Tulosten sinisyys edustaa niiden suhteellista taajuutta. Voit viedä hiiren kohteen päälle sekunnin ajan, ja taajuuspisteen pitäisi näkyä. ”Ainutlaatuisuus” -lajittelu on oletusarvoinen, ja monimutkaisen algoritmini ™ ansiosta se järjestää ne adjektiiveilla ”ainutlaatuisuus kyseiselle substantiiville suhteessa muihin substantiiveihin (se on todella melko yksinkertaista). Kuten odotat, voit napsauttaa ”Lajittelukäytön taajuus” -painiketta ja lisätä adjektiivit niiden substantiivien käyttötiheyden mukaan.

Write a Comment

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *