단어 설명
관련 단어 용 엔진을 만들 때 Describing Words 엔진에 대한 아이디어가 나왔습니다 (시소러스와 비슷하지만 동의어가 아닌 훨씬 더 광범위한 관련 단어 집합). 단어 벡터와 conceptnet의 “HasProperty”API를 가지고 놀면서 단어를 일반적으로 설명하는 형용사를 얻으려고 노력하면서 약간의 재미를 느꼈습니다. 결국 나는 거기에 있음을 깨달았습니다. “이를 수행하는 훨씬 더 좋은 방법입니다. 책을 파싱합니다!
프로젝트 구텐베르크가 초기 말뭉치 였지만 파서가 더 탐욕스럽고 탐욕스러워 져 결국 약 100 기가 바이트의 텍스트 파일 (대부분 허구)을 제공했습니다. 많은 현대 작품을 포함합니다. 파서는 단순히 각 책을 살펴보고 명사에 대한 다양한 설명을 뽑아냅니다.
그냥 참신함 이상이고 어떤 사람들은 실제로 글을 쓰고 브레인 스토밍하는 데 유용하다고 생각하지만 하나는 약간 깔끔합니다. 예를 들어 성별은 흥미 롭습니다 : “여자”대 “남자”, “소년”대 “소녀”라는 유사하지만 어떤 의미에서 다른 두 명사를 비교하는 것입니다. 픽션의 저자는 여성 (남성에 비해)을 미용 관련 용어 (체중, 특징 및 일반적인 매력과 관련하여)로 설명 할 가능성이 최소 4 배 더 높습니다. 실제로 “아름다운”은 여성에게 가장 널리 사용되는 형용사입니다. 다른 많은 미디어 형태의 여성에 대한 일반적인 일차원 적 표현과 상당히 일치하는 세계의 모든 문학. 이 문제에 대한 추가 조사를 원하는 사람이 있으면 알려 주시면 더 많은 데이터를 제공해 드릴 수 있습니다 (예 : “여성”에 대한 항목이 약 25,000 개 있습니다. 여기에 표시하기에는 너무 많습니다).
결과의 파란색은 상대적인 빈도를 나타냅니다. 항목 위로 1 초 동안 마우스를 가져 가면 빈도 점수가 나타납니다. “고유성”정렬은 기본이며, 내 복잡한 알고리즘 ™ 덕분에 다른 명사에 상대적인 특정 명사에 대한 형용사 “고유성에 따라 정렬합니다 (실제로는 매우 간단합니다). 예상대로 “사용 빈도 별 정렬”버튼을 클릭하여 해당 명사의 사용 빈도별로 형용사를 지정할 수 있습니다.