SLIDE BOW & VLAD

Por: Jose.Nascimento • 23/9/2017 • 667 Palavras (3 Páginas) • 475 Visualizações

Página 1 de 3

...

---------------------------------------------------------------

[pic 36]SIFT

(Scale Invariant Feature Transform)

- Descritores de Características

- Tem como objetivo prover informação discriminativa sobre uma região presente na imagem.

- Mapeando as informações obtidas em vetores que agrupam características espaciais da imagem.

[pic 37]

---------------------------------------------------------------

[pic 38]Clusterização

- É uma técnica não-supervisionada para separação de características em grupos de dados.

- Clusterizar dados em grupos oferece uma maneira de extrair informações relevantes de grandes conjuntos.

- Analisar clusters envolve a organização de um conjunto de padrões.

[pic 39]

---------------------------------------------------------------

[pic 40]Geração do Vocabulário Visual

[pic 41]

---------------------------------------------------------------

[pic 42]VLAD

(Vector of Locally Aggregated Descriptors)

- Vetor de representação de atributos que usa o critério de localidade das características espaciais da imagem.

- No BoW, a partir do aprendizado de k-palavras_visuais obtidas com o K-means, temos:

- C = {c1 , ..., ck} ; cada descritor x é associado a sua “palavra_visual” vizinha ci = NN(x).

[pic 43]

---------------------------------------------------------------

[pic 44]VLAD

(Vector of Locally Aggregated Descriptors)

- Ideia: consiste em acumular, para cada palavra visual ci, as diferenças (x-ci) dos vetores de x associados a ci.

- Caracterizando a distribuição dos vetores localmente agregados em relação ao centro do cluster.

- Assumimos que um descritor local seja d-dim, uma dimensão D é representada por D = k x d.

[pic 45]

---------------------------------------------------------------

[pic 46]VLAD

(Vector of Locally Aggregated Descriptors)

● Continuando:

– sendo um descritor representado por vi,j onde:

i = 1, …, k; e j = 1, …, d; respectivamente são os índices de um descritor numa visual_word.

– Assim, um componente v é obtido da soma total dos valores dos descritores da imagem.

– Onde xj e ci,j denotam respectivamente o j-ésimo componente do descritor e a palavra visual ci.

[pic 47][pic 48]

---------------------------------------------------------------

[pic 49]VLAD

(Vector of Locally Aggregated Descriptors)

- Problema: Ao codificar a imagem como um vetor há um aumento das similaridades de características compartilhadas por vetores vizinhos.

- Solução:

1 – Reduzir a dimensionalidade do vetor.

2 – Realizar a indexação dos vetores resultantes.

[pic 50]

---------------------------------------------------------------

[pic 51]VLAD

(Vector of Locally Aggregated Descriptors)

● PCA(Principal Component Analysis)

[pic 52]

---------------------------------------------------------------

[pic 53]VLAD

(Vector of Locally Aggregated Descriptors)

● Representação:

[pic 54]

---------------------------------------------------------------

[pic 55]Obrigado!

[pic 56]

...

Baixar como txt (6.9 Kb) pdf (73.8 Kb) docx (14.2 Kb)

Continuar por mais 2 páginas »

Ler documento completo Salvar

Disponível apenas no Essays.club