Definição: baseado em teoria dos conjuntos e álgebra booleana, no qual documentos e consultas (em forma de expressões booleanas) são representados como vetores binários.
Documento | Texto |
---|---|
D1 | A casa de campo é linda, azul e amarela. |
D2 | O Carro azul é de Marcelo. |
casa | campo | é | linda | azul | amarela | carro | Marcelo | |
---|---|---|---|---|---|---|---|---|
D1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
D2 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |
Número q | Consulta |
---|---|
q1 | azul |
q2 | campo ^ é |
q3 | azul ^ !linda |
q4 | azul ^ !casa |
q5 | azul ^ linda |
casa | campo | é | linda | azul | amarela | carro | Marcelo | |
---|---|---|---|---|---|---|---|---|
D1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
D2 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |
q1 = D2 | 1 | |||||||
q2 = D1 | 1 | 1 | ||||||
q3 = D2 | 0 | 1 | ||||||
q4 = D2 | 0 | 1 | ||||||
q5 = D1 | 1 | 1 |
Vantagens | Desvantagens |
---|---|
Fácil compreensão e implementação | Casamento exato entre documento e consulta é necessário |
Semântica precisa: resultados previsíveis | Critério binário pode ser ruim para a recuperação |
Suporte nativo ao operador NOT | Confusão dos usuários com operadores lógicos |
Consultas simplistas dos usuários | |
Resultados retornados podem ser excessivos ou insuficientes | |
Falta de ranqueamento torna o modelo não prático |
Vantagens:
Desvantagens: