SLIDE BOW & VLAD
Por: Jose.Nascimento • 23/9/2017 • 667 Palavras (3 Páginas) • 404 Visualizações
...
15
---------------------------------------------------------------
[pic 36]SIFT
(Scale Invariant Feature Transform)
- Descritores de Características
- Tem como objetivo prover informação discriminativa sobre uma região presente na imagem.
- Mapeando as informações obtidas em vetores que agrupam características espaciais da imagem.
[pic 37]
16
---------------------------------------------------------------
[pic 38]Clusterização
- É uma técnica não-supervisionada para separação de características em grupos de dados.
- Clusterizar dados em grupos oferece uma maneira de extrair informações relevantes de grandes conjuntos.
- Analisar clusters envolve a organização de um conjunto de padrões.
[pic 39]
17
---------------------------------------------------------------
[pic 40]Geração do Vocabulário Visual
[pic 41]
18
---------------------------------------------------------------
[pic 42]VLAD
(Vector of Locally Aggregated Descriptors)
- Vetor de representação de atributos que usa o critério de localidade das características espaciais da imagem.
- No BoW, a partir do aprendizado de k-palavras_visuais obtidas com o K-means, temos:
- C = {c1 , ..., ck} ; cada descritor x é associado a sua “palavra_visual” vizinha ci = NN(x).
[pic 43]
19
---------------------------------------------------------------
[pic 44]VLAD
(Vector of Locally Aggregated Descriptors)
- Ideia: consiste em acumular, para cada palavra visual ci, as diferenças (x-ci) dos vetores de x associados a ci.
- Caracterizando a distribuição dos vetores localmente agregados em relação ao centro do cluster.
- Assumimos que um descritor local seja d-dim, uma dimensão D é representada por D = k x d.
[pic 45]
20
---------------------------------------------------------------
[pic 46]VLAD
(Vector of Locally Aggregated Descriptors)
● Continuando:
– sendo um descritor representado por vi,j onde:
i = 1, …, k; e j = 1, …, d; respectivamente são os índices de um descritor numa visual_word.
– Assim, um componente v é obtido da soma total dos valores dos descritores da imagem.
– Onde xj e ci,j denotam respectivamente o j-ésimo componente do descritor e a palavra visual ci.
[pic 47][pic 48]
21
---------------------------------------------------------------
[pic 49]VLAD
(Vector of Locally Aggregated Descriptors)
- Problema: Ao codificar a imagem como um vetor há um aumento das similaridades de características compartilhadas por vetores vizinhos.
- Solução:
1 – Reduzir a dimensionalidade do vetor.
2 – Realizar a indexação dos vetores resultantes.
[pic 50]
22
---------------------------------------------------------------
[pic 51]VLAD
(Vector of Locally Aggregated Descriptors)
● PCA(Principal Component Analysis)
[pic 52]
23
---------------------------------------------------------------
[pic 53]VLAD
(Vector of Locally Aggregated Descriptors)
● Representação:
[pic 54]
24
---------------------------------------------------------------
[pic 55]Obrigado!
[pic 56]
25
...