*docs = documentos

Recuperação de Informação (RI) se remete a, dada uma base de docs, ser capaz de apontar um subconjunto destes que atendam à necessidade de informação do usuário;

Idealmente, os docs devem ser apresentados segundo um ranking onde os supostamente mais relevantes vêm antes dos menos relevantes;

Todavia, a relevância é um conceito subjetivo que pode depender de diversos fatores externos como localização, instante de tempo, dispositivo, preferências pessoais, nível de cultura, etc;

Recuperação de Dados Recuperação de Informação
Tarefas determinísticas e precisas; Tarefas imprecisas;
Respostas devem ser corretas; Pequenos erros são tolerados;
Sistemas não visam incorporar o significado (semântica) do que está sendo buscado. Sistemas se preocupam com
o significado do que está sendo buscado;
Ex: Alunos com CRA maior que 80; Docs com a palavra Brasil. Ex: busca por bons docs sobre o Brasil.
Bem estruturada, como em um banco de dados. limitada quando for preciso trazer informações sobre um determinado assunto. Não bem estruturadas, podem ser semanticamente ambíguos frequentemente lida com textos em linguagem natural.

Tipos de problemas de RI

Busca Filtragem Classificação
Definição Tipo comum, usuários fazem consultas e o sistema busca respostas em uma base de dados. Inverso da busca, interesses dos usuários são pré-cadastrados e docs são identificados dinamicamente Processo de selecionar e remover informações indesejadas ou irrelevantes
Base de Dados Base de docs Interesses do usuário Docs e suas categorias
Entrada Consultas dos usuários. Docs. Critérios de filtragem
Objetivo Retornar os docs que melhor atendem às consultas. Identificar os usuários que se interessam pelos docs. Enquadrar documentos em categorias adequadas, removendo informações inadequadas
Exemplos Bibliotecas digitais, busca-dores web, etc Sites de notícias, controle de correspondência, de publicações, etc. Monitoramento de lojas eletrônicas