(http://en.wikipedia.org/wiki/Entity_linking)
In natural language processing, entity linking, named entity disambiguation or named entity normalization (NEN)[1] is the task of determining the identity of entities mentioned in text. It is distinct from named entity recognition (NER) in that it identifies not the occurrence of names (and a limited classification of those), but their reference.
Entity linking needs a knowledge base of entities to which names can be linked. A popular choice for entity linking on open domain text is Wikipedia,[1][2] and when that is used, the process may be called wikification (as in the Wikify! program, an early entity linking system).[3] In a closed domain setting, a knowledge base may be induced automatically from training text.[4]
Any entity linking algorithm must battle the inherent ambiguity that even names have. Various approaches to tackle this problem have been tried. In the seminal approach of Milne and Witten, supervised learning is employed using the anchor texts of Wikipedia itself as the training data.[5] The training data also can be collected by an automatic approach based on unambiguous synonyms.[6]
Entity linking has been suggested as a way to automate the construction of a semantic web.[3] It has been used to improve the performance of information retrieval systems.[1]
자연언어처리에서 엔티티 링킹은 텍스트에서 언급된 엔티티가 무엇인지를 결정하는 일이다. NER하고는 다른것이다. 사전에 정의된 단어가 나타난 것 자체를 알아내는 것이나 그것이 몇몇 정해진 분류들 중 어디에 속하는지 알아내는 것이 아니기 때문에. 그치만 참조관계이다.
엔티티 링킹은 서로 연결될 수 있는 이름을 가진 지식기반의 엔티티를 필요로 한다. 오픈 도메인 텍스트에서 엔티티 링킹을 선택한 예는 위키피디아이닼ㅋㅋㅋ 그리고 그게 사용되어질 때, 그 과정은 아마 위키화 라고 부를 것이다. (Wikify!라는 초기 엔티티 링킹 시스템에서.. ) 닫혀진 도메인 세팅에서 지식기반은 트레이닝 텍스트에서 자동으로 감소되었을 것이다.
모든 엔티티 링킹 알고리즘은 그 이름이 가지고 있는 고유의 모호함과 싸워야 한다. 이런 문제를 해결할 다양한 접근법들이 시도되어졌다. Milne와 Witten의 유망한 접근법에서는, 위키피디아의 앵커텍스트 그 자체가 트레이닝 데이터로서 사용되어 supervised learning이 차용되었다. 트레이닝 데이터도 또한 모호하지 않은 동의어를 기반으로 하여 자동으로 수집되어질 수 있다.
엔티티 링킹은 시맨틱웹의 구축을 자동화 할 방법으로 제안되어져 왔다. 이것은 정보 검색 시스템의 성능을 향상시키는데 사용되어져왔다.
무슨 ... 다 해석했는데도 모르겠다. 써글 ㅡㅡ
제가 영어가 짧아서.. 혹시 이 글 보시는 분께서 잘못 해석한 부분을 발견하신다면 댓글로 알려주세요 : )
'춤추는 프로그래머 > Machine Learning.' 카테고리의 다른 글
공부 할 것 (0) | 2014.07.16 |
---|---|
이태리논문 ) Entity Linking의 learning relatedness 측정 요약 (1) | 2014.02.02 |
Entity Linking system (0) | 2014.01.21 |
Rough set - definitions... (from wiki) (2) | 2014.01.21 |
유한상태기계(Finite State Machine, FSM) 이란? (0) | 2013.04.10 |