*docs = documentos
Recuperação de Informação (RI) se remete a, dada uma base de docs, ser capaz de apontar um subconjunto destes que atendam à necessidade de informação do usuário;
Idealmente, os docs devem ser apresentados segundo um ranking onde os supostamente mais relevantes vêm antes dos menos relevantes;
Todavia, a relevância é um conceito subjetivo que pode depender de diversos fatores externos como localização, instante de tempo, dispositivo, preferências pessoais, nível de cultura, etc;
Recuperação de Dados | Recuperação de Informação |
---|---|
Tarefas determinísticas e precisas; | Tarefas imprecisas; |
Respostas devem ser corretas; | Pequenos erros são tolerados; |
Sistemas não visam incorporar o significado (semântica) do que está sendo buscado. | Sistemas se preocupam com |
o significado do que está sendo buscado; | |
Ex: Alunos com CRA maior que 80; Docs com a palavra Brasil. | Ex: busca por bons docs sobre o Brasil. |
Bem estruturada, como em um banco de dados. limitada quando for preciso trazer informações sobre um determinado assunto. | Não bem estruturadas, podem ser semanticamente ambíguos frequentemente lida com textos em linguagem natural. |
Busca | Filtragem | Classificação | |
---|---|---|---|
Definição | Tipo comum, usuários fazem consultas e o sistema busca respostas em uma base de dados. | Inverso da busca, interesses dos usuários são pré-cadastrados e docs são identificados dinamicamente | Processo de selecionar e remover informações indesejadas ou irrelevantes |
Base de Dados | Base de docs | Interesses do usuário | Docs e suas categorias |
Entrada | Consultas dos usuários. | Docs. | Critérios de filtragem |
Objetivo | Retornar os docs que melhor atendem às consultas. | Identificar os usuários que se interessam pelos docs. | Enquadrar documentos em categorias adequadas, removendo informações inadequadas |
Exemplos | Bibliotecas digitais, busca-dores web, etc | Sites de notícias, controle de correspondência, de publicações, etc. | Monitoramento de lojas eletrônicas |