Essays.club - TCC, Modelos de monografias, Trabalhos de universidades, Ensaios, Bibliografias
Pesquisar

SLIDE BOW & VLAD

Por:   •  23/9/2017  •  667 Palavras (3 Páginas)  •  382 Visualizações

Página 1 de 3

...

15

---------------------------------------------------------------

[pic 36]SIFT

(Scale Invariant Feature Transform)

- Descritores de Características

- Tem como objetivo prover informação discriminativa sobre uma região presente na imagem.

- Mapeando as informações obtidas em vetores que agrupam características espaciais da imagem.

[pic 37]

16

---------------------------------------------------------------

[pic 38]Clusterização

- É uma técnica não-supervisionada para separação de características em grupos de dados.

- Clusterizar dados em grupos oferece uma maneira de extrair informações relevantes de grandes conjuntos.

- Analisar clusters envolve a organização de um conjunto de padrões.

[pic 39]

17

---------------------------------------------------------------

[pic 40]Geração do Vocabulário Visual

[pic 41]

18

---------------------------------------------------------------

[pic 42]VLAD

(Vector of Locally Aggregated Descriptors)

- Vetor de representação de atributos que usa o critério de localidade das características espaciais da imagem.

- No BoW, a partir do aprendizado de k-palavras_visuais obtidas com o K-means, temos:

- C = {c1 , ..., ck} ; cada descritor x é associado a sua “palavra_visual” vizinha ci = NN(x).

[pic 43]

19

---------------------------------------------------------------

[pic 44]VLAD

(Vector of Locally Aggregated Descriptors)

- Ideia: consiste em acumular, para cada palavra visual ci, as diferenças (x-ci) dos vetores de x associados a ci.

- Caracterizando a distribuição dos vetores localmente agregados em relação ao centro do cluster.

- Assumimos que um descritor local seja d-dim, uma dimensão D é representada por D = k x d.

[pic 45]

20

---------------------------------------------------------------

[pic 46]VLAD

(Vector of Locally Aggregated Descriptors)

● Continuando:

– sendo um descritor representado por vi,j onde:

i = 1, …, k; e j = 1, …, d; respectivamente são os índices de um descritor numa visual_word.

– Assim, um componente v é obtido da soma total dos valores dos descritores da imagem.

– Onde xj e ci,j denotam respectivamente o j-ésimo componente do descritor e a palavra visual ci.

[pic 47][pic 48]

21

---------------------------------------------------------------

[pic 49]VLAD

(Vector of Locally Aggregated Descriptors)

- Problema: Ao codificar a imagem como um vetor há um aumento das similaridades de características compartilhadas por vetores vizinhos.

- Solução:

1 – Reduzir a dimensionalidade do vetor.

2 – Realizar a indexação dos vetores resultantes.

[pic 50]

22

---------------------------------------------------------------

[pic 51]VLAD

(Vector of Locally Aggregated Descriptors)

● PCA(Principal Component Analysis)

[pic 52]

23

---------------------------------------------------------------

[pic 53]VLAD

(Vector of Locally Aggregated Descriptors)

● Representação:

[pic 54]

24

---------------------------------------------------------------

[pic 55]Obrigado!

[pic 56]

25

...

Baixar como  txt (6.9 Kb)   pdf (73.8 Kb)   docx (14.2 Kb)  
Continuar por mais 2 páginas »
Disponível apenas no Essays.club