//Технологический блог на русском языке, освещающий технологии NN-VIDEOLAB.net и связанные с ними вопросы.
пятница, 17 ноября 2017 г.
четверг, 9 ноября 2017 г.
UBUNTU. Git-Cola
Постоянная ссылка на проект.
http://git-cola.github.io/
Был установлен на Ubuntu под Virtual Box и позволил скачать из репозитория GitHub необходимые проекты зафиксировать изменения.
Вывод: признан работоспособным.
вторник, 22 августа 2017 г.
Мозг в колбе
"Мозг в колбе" – это ряд мысленных экспериментов, предназначенных для того, чтобы понять определенные элементы нашего представления о знаниях, реальности, правде, разуме и значения. Это предполагает следующее:
· Наш мозг является источником сознания.
· Мозг работает на электрических импульса .
· Внешние стимулы могут повлиять на то, как работает мозг.
· Любой внешний стимул к мозгу можно симулировать до такой степени, что мозг не сможет различить симулированные стимулы от естественных.
Суть состоит в том, что Вы можете представлять собой "мозг в банке", который всю жизнь питается внешним источником ложными импульсами. Также есть версия, что вы (являясь мозгом в банке) всю жизнь видите галлюцинации из-за отсутствия стимулов.
суббота, 12 августа 2017 г.
Shelves module.
- Исходные данные:
- Видеофайлы.
- Файлы изображений.
- Слайд шоу.
- Файл параметров. В версии 1.2 файл параметров загружается отдельно и не связан с видеофайлом.
- Выходные данные. Лог-файлы с определенными свободными местами на прилавках. Имя файла соответствует имени файла исходных данных.
- Для видеофайла выходным файлом будет файл, где для каждого кадра и для каждой зоны наблюдения сохраняются данные о свободных местах на прилавке.
- Для файла изображения выходным файлом будет файл где указаны свободные места на прилавке.
- Режимы работы.
- Режим поиска свободных мест. В этом режиме программа создает и записывает данные в лог-файлы.
- Режим настройки параметров для каждой зоны наблюдения. Этот режим работает только на исходных данных типа Слайд-Шоу. Пользователь в ручном режиме указывает свободные места на одном или нескольких файлах, программа сохраняет эти данные в специальные файлы и использует их для настройки параметров.
- Режим оценки точности работы алгоритма. Этот режим работает только на исходных данных типа Слайд-Шоу. В этом режиме программа, при заданных параметрах оценивается % неправильно найденной свободной площади для каждого кадра и % не найденной свободной площади для каждого кадра по некоторой выборки из слайд-шоу.
Настройка детектора свободного места на прилавках с использованием компонента Photon4.TZonesTool
- Исходно
- Для выбранной камеры, изображения или файла указываются области наблюдения. Области наблюдения записываются в файл xml.
- Переключение между режимами просмотра и режимами редактирования осуществляется с помощью всплывающего меню.
- В главном окне программы находится копия TLFZones тех зон, которые есть в инструменте. Переключение режимов приводит к копированию зон.
- Зоны бывают двух типов. 1. Зоны наблюдения, по которым формируется маска 2. зоны для настройки параметров, которые описывают свободное место на полках. Редактор зон второго типа запускается дополнительной командой всплывающего меню. Например "Указать свободное место". В этом случае в TLFZones копируются зоны для конкретного фрейма.
- Сохранение данных.
- Данные о зонах и чувствительности детектора для каждой зоны сохраняются в файле с расширением .params
- Данные о свободных зонах сохраняются в файле с расширением .zones
пятница, 11 августа 2017 г.
Типы лицензий OpenSource
GNU GPL (GNU General Public License) — одна из наиболее распространенных open source-лицензий. Под этой лицензией распространяются ядро Linux, MySQL, Asterisk и многие другие. Большинство CMS систем, таких как MovableType, MODx, WordPress, Joomla, Drupal, osCommerce и множество других выпускаются под GPL. По разным данным, в мире до 70% open source-ПО выпускается под GPL.
Основная цель GPL - защитить открытость свободного ПО. Он призван защитить разработчиков от того, что их наработки будут использованы создателями закрытого ПО в своих продуктах. Основное условие GPL: продукт, использующий код, защищенный этой лицензией, должен распространяться также под GPL и его исходный код должен быть доступен получателю такого продукта, который может делать с этим кодом все что угодно в рамках GPL.
Таким образом, если вы создаете проект на основе кода, защищенного GPL, вы обязаны распространять свой продукт под GPL. Распространение в данном случае не означает только лишь дистрибуцию конечного продукта. Под этот термин подпадает также и передача продукта заказчику исходных кодов ПО. Единственная ситуация, в которой требования GPL не являются обязательными, — отсутствие факта распространения как такового. То есть вы используете модифицированный код исключительно в личных целях или в целях компании, в которой работаете.
LGPL
GNU LGPL (GNU Lesser General Public License) отличается от GPL тем, что позволяет использовать продукты LGPL в проектах, распространяемых под другими лицензиями. То есть условия, сходные с GPL, распространяются только на ту часть производного продукта, которая заимствована из продукта, защищенного LGPL.
Изначально создатели GPL и LGPL – Free Software Foundation – предполагали использование GPL в готовых продуктах, а LGPL — в библиотеках для разработчиков, но на данный момент такое разделение не соответствует действительности. Наиболее известный продукт, выпускаемый под LGPL, – OpenOffice.org.
BSD
BSD (Berkeley Software Distribution) представляет противоположный фланг лицензирования open source-продуктов. Это очень либеральная и очень короткая лицензия. От разработчиков, использующих ПО, распространяемое под лицензией BSD, требуется лишь указывать в документации, что в продукте используются разработки создателей оригинального программного обеспечения и запрещается использовать имена (или названия) создателей этого ПО в рекламных целях без их письменного согласия. Также необходимо включать стандартный текст об ограничении ответственности разработчиков за последствия использования данного ПО.
Таким образом разработки, распространяемые под BSD, можно смело использовать в своих не open source-проектах при соблюдении этих несложных условий. Самой известной компанией, использующей преимущества лицензии BSD является компания Apple.
MIT
MIT (Massachusetts Institute of Technology), является так же «разрешающей» лицензией. То есть ПО, лицензируемое под MIT, можно использовать в закрытых продуктах. Единственным существенным отличием от BSD является отсутствие пункта, запрещающего использовать название продукта и имена создателей в рекламных целях.
X Window System (X11), Ruby on Rails — наиболее известные проекты, распространяемые под MIT.
Tokyo
Борланд наконец-то сделал бесплатную сборку C++ Builder. Правда она имеет существенные ограничения, тем не менее позволяет собирать и распространять компоненты и приложения абсолютно легально.
Семантический анализ изображений.
В приложении к изображениям будем считать, что его семантический анализ заключается в обозначении некоторых областей или всего изображения единицами естественного языка. В нашем случае словами существительными и словами прилагательными.
Проблемы семантического анализа.
- Объект (понятие) состоит из более мелких понятий – структура объекта. Например, структура лица человека состоит из собственно характерного овала, глаз, носа, рта, бровей, возможно ушей. Само лицо является частью головы. Причем нос нельзя свести к атрибутам – нос есть всегда и слово носатый относится к свойствам самого носа! Это означает, необходима концепция полного описания объекта. Наличие минимальной структурной единицы. Локализация понятия на изображении не исчерпывает задачу.
- Кроме того, объект находится в какой то среде. Является ли эта среда с нашей точки зрения объектом? Описание сцены – вот что тоже нужно обсудить. Нужно найти модельную ситуацию, в которой сцена может быть описана с применением наших технологий достаточно хорошо. Описание сцены не сводится просто к описанию объектов. Это уже более широкая задача. Это и связи между объектами, количество однотипных объектов, информация об относительных размерах объектов и т.п. Может быть, выделять планы, имеется в виду передний план, задний план, объекты задающие характерные размеры, например монета, на фотографии с электронными устройствами. Соответственно таблица описания изображений должна учитывать такие характеристики.
- Важно описывать связь между объектами. Пространственная связь (самая простая), определяемая координатами объектов, должна правильно выражаться на естественном языке. Более сложное описание связей это соотношений частей самого объекта - поз объекта. Например, если объект человек, то положение рук, ног, стоит, сидит или лежит. Если лицо, то в фас или профиль (левый или правый), куда или на кого смотрит и т.п.
- Должно отражаться количество однотипных объектов, их взаимное расположение.
- Далее мало внимания уделяется вопросу описания низкоуровневых характеристик изображения - наличие локальных точек, распределение цветов, и т.п. Я бы сказал, что получение низкоуровневых характеристик это необходимый этап предобработки изображения для его дальнейшего анализа. Нужно ли это делать? Поможет ли находить изображения? Насколько важно хорошо делать сегментацию изображения? Поможет ли сегментация в описании сцен, в ускорении поиска объектов.
- Большое количество детекторов приводит к проблеме, связанной со скоростью анализа изображения. Нужны какие-то идеи, алгоритмы по эвристическому, ассоциативному ограничению детекторов при каждом следующем шаге при анализе изображения. То есть нужно понять как ввести систему знаний о мире в программное решение.
Обработка изображений и их анализ.
- Конвертация изображений
- Нормировка изображений
- Фильтрация изображений
- Геометрические преобразования
- Отрисовка геометрических примитивов на изображениях.
- Вычисление статистических характеристик изображения S(x,y)
- Нахождение геометрических кластеров на изображении и вычисление их характеристик.
- Нахождение объектов заданного типа на изображении.
- Вычисление признаков изображения.