Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 14.11.2016
Сообщений: 35

Поиск фрагмента в изображении

29.03.2017, 22:30. Показов 1245. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Использую библиотеку fftw. Хочу написать программу, которая бы быстро находила фрагмент в большом изображении. При это данный фрагмент - это какая-нибудь часть этого изображения. Сначала всё делалось в лоб: циклом по всем точкам и минимизируем функционал разности. Но это долго. Поэтому было решено использовать БПФ. Вот, что имею на данный момент:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
#include <fstream>
#include <complex>
#include <vector>
#include <iostream>
 
#include "fftw3.h"
 
using namespace std;
 
void loadData(vector<complex<double>> &arr, int w, int h){
    arr.clear();
    arr.resize(w*h);
 
    for (int y = 0; y < h; y++) {
        for (int x = 0; x < w; x++) {
            arr[y * w + x] = rand()%5 + 0;
        }
    }
}
 
void loadFragment(vector<complex<double>> arr, int w, int h, vector<complex<double>> &fragment, int xo, int yo, int wf, int hf){
    fragment.clear();
    fragment.resize(wf*hf);
 
    for (int y = yo; y < yo+hf; y++) {
        for (int x = xo; x < xo+wf; x++) {
            fragment[(x-xo)+(y-yo)*wf] = arr[x+y*w];
        }
    }
}
 
void fft2(vector<complex<double>> arr, int w, int h, vector<complex<double>> &out){ 
    out.clear();
    out.resize(w*h);
    fftw_plan plan = fftw_plan_dft_2d(w, h, (fftw_complex*) &arr[0], (fftw_complex*) &out[0], FFTW_FORWARD, FFTW_ESTIMATE);
    fftw_execute(plan);
}
 
void ifft2(vector<complex<double>> arr, int w, int h, vector<complex<double>> &out){    
    out.clear();
    out.resize(w*h);
    fftw_plan plan = fftw_plan_dft_2d(w, h, (fftw_complex*) &arr[0], (fftw_complex*) &out[0], FFTW_BACKWARD, FFTW_ESTIMATE);
    fftw_execute(plan);
 
    for (int y = 0; y < h; y++) {
        for (int x = 0; x < w; x++) {
            out[y * w + x] = out[y * w + x].real() / (w * h);
        }
    }
}
 
void expandArr(vector<complex<double>> &arr, int w, int h, int wf, int hf){
    vector<complex<double>> temp;
    temp.resize(w*h);
 
    for (int y = 0; y < hf; y++) {
        for (int x = 0; x < wf; x++) {
            temp[y * w + x] = arr[y * wf + x];
        }
    }
 
    arr.clear();
    arr.resize(w*h);
 
    for (int y = 0; y < h; y++) {
        for (int x = 0; x < w; x++) {
            arr[y * w + x] = temp[y * w + x];
        }
    }
}
 
void print(vector<complex<double>> arr, int w, int h){
    for (int y = 0; y < h; y++) {
        for (int x = 0; x < w; x++) {
            cout << arr[y * w + x] << " ";
        }
        cout << endl;
    }
    cout << endl;
}
 
void conj(vector<complex<double>> &arr){    
    for(int k = 0; k < arr.size(); ++k) arr[k].imag(arr[k].imag()*(-1));
}
 
void avarage(vector<complex<double>> &arr){
    double a = 0;
 
    for (int y = 0; y < arr.size(); y++) a += arr[y].real();
 
    a /= arr.size();
 
    for (int y = 0; y < arr.size(); y++) arr[y] -= a;
}
 
void main()
{
    int w = 500;
    int h = 500;
    vector<complex<double>> arr;
    loadData(arr, w, h);
    avarage(arr);
 
    vector<complex<double>> forward;
    fft2(arr, w, h, forward);
    conj(forward);
 
    vector<complex<double>> fragment;
    int xo = 15;
    int yo = 35;
    int wf = 50;
    int hf = 60;
 
    loadFragment(arr, w, h, fragment, xo, yo, wf, hf);
    avarage(fragment);
    expandArr(fragment, w, h, wf, hf);
    vector<complex<double>> forwardF;
    fft2(fragment, w, h, forwardF);
 
    vector<complex<double>> conv;
 
    for (int y = 0; y < h-hf; y++) {
        for (int x = 0; x < w-wf; x++) {
            complex<double> sum = 0;
            for (int j = y; j < y+hf; j++) {
                for (int i = x; i < x+wf; i++) {
                    sum += (forwardF[i-x,j-y]*forward[x,y]);    
                }
            }
            sum /= (wf*hf);
            conv.push_back(sum);
        }
    }
 
    vector<complex<double>> backward;
    ifft2(conv, w-wf, h-hf, backward);
 
    system("pause");
}
а что дальше делать - не знаю. В интернете пишут, что нужно найти максимум модуля взаимной корреляции для определения координат фрагмента. Но про какой модуль говорится - не пойму. Буду рада помощи.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
29.03.2017, 22:30
Ответы с готовыми решениями:

Поиск связных областей на изображении
Всем доброго времени суток. Наткнулся на htrehcbdysq алгоритм поиска связных областей на изображении (псевдокод): void Labeling(BIT*...

Поиск фрагмента текста
Здравствуйте сделал вот такой цикл #include &lt;string&gt; using namespace std; int main() { string str = &quot;asdf hsert 2r...

Поиск пикселей в изображении
В общем ситуация такая: нужно получить скрин экрана и найти координаты пикселей определённого цвета, к примеру белого. И это должно...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
29.03.2017, 22:30
Помогаю со студенческими работами здесь

Поиск фрагмента в изображении
Т.к. не нашёл удовлетворяющего меня решения, сделал сам. Выкладываю, может кому пригодится. from PIL import Image def...

Поиск изображения в изображении
Привет. Допустим у меня есть изображение в битмапе, и мне нужно его найти в сделанном программой скриншоте экрана, и если его нашло вернуть...

Поиск изображения в изображении
имеется два изображения *.bmp. Первое(1.bmp, width==480, height==640), второе(2.bmp, width==24, height==20). Вообщем мне надо найти...

Поиск элемента на изображении
Задача такова: программа создаёт скриншот экрана. Имея некоторое изображение.bmp, нам надо найти координаты этого изображения.bmp на...

Поиск текста в изображении
Ситуация такова: Есть цветное изображения x*y размера надо найти текст(на белом фоне) он его цвет (R:0, G:0 B:0) вообщем чёрный(но пиксели...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru