Форум программистов, компьютерный форум, киберфорум
Проекты
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.78/59: Рейтинг темы: голосов - 59, средняя оценка - 4.78
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155

Специальная тема по компьютерному зрению

02.09.2022, 20:31. Показов 15497. Ответов 175
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте.

Я ищу программиста для общей работы по рассмотрению идеи для распознавания изображения.

Размещал заказ для фрилансеров о консультации по проблеме компьютерного зрения. Общий ответ на вопрос нашел в интернете.

В большинстве случаев пытаются использовать монохроматическое изображение, моя идея - использовать определенный фильтр и, далее, если не найти метод распознавания, попробовать обобщить вытекающий из идеи, но проверить это не могу.

Что хочу предложить вам? Вы как программист должны представлять как использовать идею, если она работоспособна, поэтому предлагаю принять участие в ее рассмотрении.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
02.09.2022, 20:31
Ответы с готовыми решениями:

Задача по компьютерному зрению
Добрый день! Помогите решить задачу в области компьютерного зрения - отличие объектов по цвету. Например: 1) и , имеют одинаковую...

Специалист по компьютерному зрению ООО СтендАп Инновации
Привет, будущий коллега! Мы создаём крутые инновационные продукты для детского образования. Наша основная миссия: создавать и...

Не вредит ли монитору и зрению режим sRGB?
И контраст 70 при этом?

175
Эксперт .NET
 Аватар для Usaga
14337 / 9430 / 1358
Регистрация: 21.01.2016
Сообщений: 35,555
06.09.2022, 16:45
Студворк — интернет-сервис помощи студентам
tomater, я тоже не понимаю до конца. В этом и прикол) Мы с вам обычные работяги, которые только краем этого вопроса касаются.

Я по сервисам гугла, яндекса, эппла и ms вижу, что они системы распознавания стараются применять как можно шире. Это не просто так. Значит оно окупается. И если учесть, что некий профиль юзера стоит каких-то денег (опять же, не напрямую), то это всё не просто игры в понты.
1
118 / 51 / 1
Регистрация: 17.03.2021
Сообщений: 178
06.09.2022, 16:56
Кстати да, мои патенты - в области распознавания как раз.

Добавлено через 8 минут
Цитата Сообщение от Usaga Посмотреть сообщение
Я по сервисам гугла, яндекса, эппла и ms вижу, что они системы распознавания стараются применять как можно шире. Это не просто так. Значит оно окупается. И если учесть, что некий профиль юзера стоит каких-то денег (опять же, не напрямую), то это всё не просто игры в понты.
Мне довелось близко соприкоснуться с тем, как мыслят инвесторы и шерхолдеры подобных компаний. Рискну предположить, что всё гораздо хуже, и большинство их игр в AI глубоко убыточны и не имеют такого уж существенного влияния на их текущий бизнес. На западе очень сильно поверили в тезис "AI - это новая нефть", и ведут войну на опережение на этом поле, чтобы захватить наиболее выгодные позиции задолго до того, как это все станет иметь хоть какой-то практический смысл. Но зато тогда они будут в дамках, благодаря своему доминирующему положению. На самом деле, очень много, что они делают имеет подобную мотивацию, основанную на страхе перед тем, что завтра весь ландшафт изменится, а они будут к этому не готовы и профукают свои лидирующие позиции. Благо исторических примеров предостаточно, на MBA их активно изучают.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
06.09.2022, 17:03  [ТС]
Я интересовался темой ML, кстати, я уже пытался коммерциализовать другую идею, пробовал установить пример программы для распознавания, где, необходимо, загрузить 200 фото для обучения, пытался узнать стоимость быстрообучаемых программ, и узнать о программах с кастомным обучением, чтобы двигаться в направлении развития, но все что есть - общая информация, по которой сложно понять, тем более, что специалисты до сих пор не сформулировали, проблему распознавания, что может уже являться чьей-то коммерческой тайной.
0
118 / 51 / 1
Регистрация: 17.03.2021
Сообщений: 178
06.09.2022, 17:14
А я был в автосалоне Теслы и даже сидел за рулём. Но к сожалению, это не делаем меня Илоном Маском. Но вы, похоже, считаете, что ваши эксперименты уже сделали из вас Andrew Ng. Хотя о чем это я, вы даже не в курсе кто это.

Добавлено через 5 минут
Вот когда сможете мне рассказать чем hinge loss отличается от sigmoid и в каком случае какую применять, тогда сможете говорить, что "интересовались темой ML". Тогда будет смысл с вами обсуждать ваши идеи.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
06.09.2022, 19:23  [ТС]
Так сложилось, что у меня гуманитарное образование и поэтому обучение пониманию и применению на практике математических функций займет очень большое количество времени. Из информационной мозаики интернета понятно, что:

Есть информация по которой понятно, что есть методы использования ПО по распознаванию, с методами:
метод перебора вида объекта под различными углами, масштабами, смещениями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д.

другой метод найти контур объекта и исследовать его свойства (связность, наличие углов и т. д.)

и метод использования искусственных нейронных сетей. Этот метод требует либо большого количества примеров задачи распознавания (с правильными ответами) - обучение, либо специальной структуры нейронной сети, учитывающей специфику данной задачи- не обобщенный метод, со своим решением для каждой рассматриваемой задачи.

По тому, что вы написали, я нашел, что это математические функции относящиеся к методу использования, видимо, разных типов искусственных нейронных сетей, так как используются для машинного обучения.

Сигмоиды используются для существенного сокращения вычислительной сложности метода обратного распространения ошибки при обучении (машинное обучение) с учителем одного из базовых видов кибернетической модели мозга, сделав его (метод) применимым на практике.

Hinge loss в машинном обучении используется для обучения классификаторов, как штраф за неправильную классификацию примера. В первую очередь для машин с опорным вектором, которые анализируют данные для классификации и регрессионного анализа.

Добавлено через 3 минуты
Наиболее часто в задачах распознавания образов рассматриваются монохромные изображения, что дает возможность рассматривать изображение как функцию на плоскости. Я предполагаю, что-то из этого направления
0
118 / 51 / 1
Регистрация: 17.03.2021
Сообщений: 178
06.09.2022, 19:38
Увы, зачёт не сдан. Но спасибо, что хоть не поленились залезть в википедию. Тем не менее, терминологией, необходимой для предметной дискуссии по поднятому вопросу, к сожалению, не владеете.

Добавлено через 8 минут
Если вы все-таки серьезно хотите "интересоваться темой ML", могу порекомендовать изучить вот этот вот курс лекций:
https://www.youtube.com/playli... Wr4qEE1Zxk
Я сам его изучал, прорешал все задания. Очень помогло подтянуть свои знания в ряде областей ML и машинного зрения в частности. Вот когда изучите - тогда смело сможете разговаривать на эти темы с пониманием вопроса. Там, частности, станет понятно что я имел в виду под hinge loss и singmoid. Но в процессе все ваши текущие "гениальные идеи" сами собой рассосуться, но это даже хорошо.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
06.09.2022, 21:51  [ТС]
желтый фильтр синего наиболее сложного цвета и всех остальных плюс белая сетка для измерения движения
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
06.09.2022, 21:55  [ТС]
[img]1366476[/img]
Миниатюры
Специальная тема по компьютерному зрению  
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
06.09.2022, 21:56  [ТС]
пример распознавания синей искаженной надписи сделан при помощи желтой линзы
0
118 / 51 / 1
Регистрация: 17.03.2021
Сообщений: 178
06.09.2022, 22:38
Цитата Сообщение от Vladimir2325 Посмотреть сообщение
пример распознавания синей искаженной надписи сделан при помощи желтой линзы
Я поражаюсь вашему упорству. Вам же открытым текстом пишут, что никому не интересно обсуждать ваши "идеи". Потому что в них нет и не может быть никакой ценности. Ну похимичили вы вручную над одним изображением, и получили более высокое качество распознавания. И что? В этом нет абсолютно никакой ценности. Любой, даже самый гениальный AI можно улучшить, если вручную подготавливать изображения. Но в том-то и суть, что AI должен работать САМ, БЕЗ специальной подготовки, иначе никакой это не AI, и он вовсе не заменяет труд человека, как должен.

Проблема со всеми этими фильтрами и шаманствами в том, что они улучшают качество только на ОДНОМ изображении. А на остальных ухудшают, и там надо другие фильтры и шаманства применять. AI настраивают на сотнях тысячах и даже миллионах изображений, подгоняя параметры обработки таким образом, чтобы В СРЕДНЕМ качество было максимальное. Но всегда будут краевые случаи, на которых эти УСРЕДНЕННЫЕ параметры не оптимальны, и ручным подбором фильтров можно сделать лучше. Но ЭТО НОРМАЛЬНО. ТАК И НАДО.

Есть еще вариант запускать перебор по разным параметрам фильтрации, выжав таким образом еще пару процентов точности, но сильно потеряв в производительности, а значит увеличив расходы на сервера (а продукт-то бесплатный, как мы помним). Любой продукт на основе AI - это всегда компромисс, балланс огромного количества параметров, и всегда гарантировано можно сделать лучше по одному из параметров, например точности, причем очень легко, просто это не нужно для данной задачи.

Поэтому еще раз повторю, не надо думать, что разработчики той программы тупые или ленивые и не знают как сделать лучше. Они знают, уж точно гораздо больше вашего знают, и в ваших идеях для них нет ничего нового. Они все их давно опробовали. Но не стали их применять по ряду причин. Потому что нашли оптимальный для их задачи баланс в другой точке.

Поэтому еще раз вас прошу. Успокойтесь уже. Ваши идеи НИКОМУ не интересны. Ваше желание сделать ИХ продукт точнее тоже никого не волнует. Он такой, какой должен быть. Целей разработчиков он достигает, а что вам это не нравится их вообще не заботит, потому что продукт бесплатный и цель была вовсе не в том, чтобы он вам нравился.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
14.09.2022, 12:33  [ТС]
Мне в одном месте сказали по поводу моей идеи: Мы в общих чертах предполагаем, зачем все это нужно. И, затем, что разработки в предлагаемом направлении не приоритетны.
Не хочет кто-нибудь обсудить, у меня вопрос, может это ерунда, но: есть ли какая либо теория относительно поиска нужного цвета для фильтра, которая требует огромных расчетов?
0
118 / 51 / 1
Регистрация: 17.03.2021
Сообщений: 178
14.09.2022, 13:47
Все верно, вам ответили то же самое, что я пытался донести до вас, в том числе предпоследнем сообщении. Только предельно корректно и без подробностей.

Цитата Сообщение от Vladimir2325 Посмотреть сообщение
есть ли какая либо теория относительно поиска нужного цвета для фильтра, которая требует огромных расчетов?
Задач, в которых может теоретически потребоваться перебор параметров фильтрации - полно. Это практически все задачи компьютерного зрения. Но разработчики обычно стараются избегать перебора, именно потому, что а) очень вычислительно затратно б) не всегда понятно, как автоматически оценивать результат и выбирать лучший вариант. Вот выбрали вы какие-то параметры цвет, и текст распознался с большим процентом уверенности - но это не всегда означает, что он распознался точнее, он вполне мог просто выдать более уверенный ответ на мусоре.

Поэтому чаще всего ищут какие-то инвариантные преобразования, которые не зависят от цвета, например. А только его изменения.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
14.09.2022, 19:32  [ТС]
Одухотворять AI я бы не стал. Я не программист, чтобы делать выводы, я понимаю, что специалисты перебрали все способы, когда разбирал свою фото единственный способ, который пришел на ум перебор комбинаций из складываемых частей объекта при сравнении с шаблоном до установления класса объекта, т.е. складывать однотонные части до тех пор пока не будет установлено сходство с каким-либо шаблоном, я как неспециалист могу сделать вывод, что это очень ресурсоемко, если вообще выполнимо.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
16.09.2022, 22:09  [ТС]
[img]1368384[/img]
Миниатюры
Специальная тема по компьютерному зрению  
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
17.09.2022, 03:49  [ТС]
Дополнение по поводу построения фигуры для сравнения с шаблоном: рассчитывать общий оттенок по гармонической средней до появления пограничного цвета, его можно оценить как границу или как отдельную фигуру, например, блик.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
17.09.2022, 12:04  [ТС]
Если, например, поставить задачу написать программу распознавания по шаблону, то для классификации все равно будет нужен признак или признаки класса для поиска на изображении и установления сходства?

Добавлено через 1 минуту
Т.е. вмешательство человека для составления базы классов с признаками необходимо?

Добавлено через 35 минут
В данной теме ищу партнера для проверки идеи.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
17.09.2022, 21:59  [ТС]
Есть дополнение по цветам.
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
23.11.2022, 10:44  [ТС]
Здравствуйте. Вопрос к специалистам: возможно устроить сканирование перекинутого с камеры изображения в оперативной памяти, как начало способа распознавания-в интернете не нашел инфы?
0
Эксперт .NET
 Аватар для Usaga
14337 / 9430 / 1358
Регистрация: 21.01.2016
Сообщений: 35,555
23.11.2022, 12:01
Vladimir2325, что?)
0
-67 / 1 / 0
Регистрация: 17.08.2022
Сообщений: 155
23.11.2022, 12:03  [ТС]
Появилась упомянутая идея, но теоретически не представляю, как можно сделать.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
23.11.2022, 12:03
Помогаю со студенческими работами здесь

Стартап. Устройство для лиц с инвалидностью по зрению. Как реализовать?
Приветствую. Собираюсь основать стартап. Идея следующая. Многим лицам с инвалидностью по зрению, являющимся полностью слепыми,...

Задача по компьютерному моделированию
В автоматизированную информационную систему поступают запросы с интенсивностью λ = 5 (запросов в мин). Среднее время ответа Тотв =...

Литература по компьютерному железу
Доброго времени суток! Подскажите, пожалуйста. какие-то книги по работе компьютерных комплектующих.

Задание по компьютерному моделированию
Построить модель демонстрирующую силу трения Нужен рисунок

Литература по компьютерному железу
Имею хорошие знания в программировании, но так вышло, что в компьютерном железе полный чайник :cry: Посоветуйте литературу: 1) Для...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
40
Ответ Создать тему
Новые блоги и статьи
[golang] Двоичная куча, min-heap
alhaos 20.05.2026
Двоичная куча Двоичная куча — структура данных, которая всегда держит самый важный элемент наготове. Представьте очередь к хилеру в игре, и очередь из игроков в приоритете те у кого меньше. . .
[golang] Breadth-First Search
alhaos 19.05.2026
BFS (Breadth-First Search) — это базовый алгоритм обхода графа в ширину, который поуровнево исследует все связанные вершины. Он начинает с выбранной точки и проверяет всех соседей, прежде чем. . .
[golang] Алгоритм «Хак Госпера»
alhaos 17.05.2026
Алгоритм «Хак Госпера» Хак Госпера (Gosper's Hack) — алгоритм нахождения следующего по величине числа с тем же количеством установленных бит. Придуман Биллом Госпером в 1970-х, опубликован в. . .
Рисование бинарного древа до 6-го колена на js, svg.
russiannick 17.05.2026
<svg width="335" height="240" viewBox="0 0 335 240" fill="#e5e1bb"> <style> <!]> </ style> <g id="bush"> </ g> </ svg> function fn(){ let rost;/ / высота древа let xx=165,yy=210,w=256;
FSharp: interface of module
DevAlt 16.05.2026
Интерфейс модуля F# позволяет управлять доступностью членов, содержащихся в реализации модуля. По-умолчанию все члены модуля доступны: module Foo let x = 10 let boo () = printfn "boo" . . .
Хитросплетение родственных связей пантеона греческих богов.
russiannick 14.05.2026
Однооконник, позволяющий узреть и изучить отдельных героев древней Греции. <!DOCTYPE html> <html lang="ru"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible". . .
[golang] Угол между стрелками часов
alhaos 12.05.2026
По заданным значениям часа и минуты необходимо определить значение меньшего угла между стрелками аналогового циферблата часов. import "math" func angleClock(hour int, minutes int) float64 { . . .
Debian 13: Установка Lazarus QT5
ВитГо 09.05.2026
Эта инструкция моя компиляция инструкций volvo https:/ / www. cyberforum. ru/ blogs/ 203668/ 10753. html и его же старой инструкции по установке Lazarus с gtk2. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru