Karen Spärck Jones
A súa carreira de investigación iniciouse en 1950 cando desenvolveu un tesauro (lista de palabras ou termos empregados para representar conceptos) para a Unidade de Investigación na Linguaxe da Universidade de Cambridge. Posteriormente, doctorouse cunha tese en Sinonimia e clasificación semántica, utilizando técnicas estatísticas e probabilísticas combinadas coa lingüística. Puido seguir investigando en recuperación de información grazas a diferentes becas, ata que fichou polo Laboratorio de Informática da universidade, onde traballou ata a súa xubilación.
Karen liderou a indización automatizada creando un indicador capaz de atopar a importancia informativa dunha palabra para un documento, o que se chamaría a partir de entón a indización ponderada ou por pesos. Este algoritmo, chamado ITF, obtén a importancia dun termo dependendo do número de veces que apareza no documento en relación co resto de termos que este teña. Este obvía as palabras que aparezan en exceso (preposicións e conxuncións) así como por defecto (palabras con poucas aparicións), xa que considera que non aportan suficiente valor informativo.
Este indicador daría paso a outro máis importante, o IDF, cuxo procedemento é
similar pero emprégase unha base de datos documentada. Con el, obteríanse ordenados de maior a menor relevancia os documentos atopados ao responder unha consulta. Este deseño sería o principio do modelo probabilístico de recuperación de información.
Grazas á labor de toda unha vida, levou numerosos premios coma a Medalla Lovelace, o que, sen dúbida algunha, acreditan a súa grande labor para a informática.
Comentarios
Publicar un comentario