16
апреля
2021
год
Большие данные и искусственный интеллект в ArtLab СурГУ
Первокурсник направления «программная инженерия» Политехнического института Сургутского госуниверситета Максим Заказчик разработал прототип для определения по изображению игрушечная или настоящая модель машины. Проект по машинному обучению студент представил на научно-техническом семинаре идей, практик и прототипов «Большие данные и искусственный интеллект», организованном Лабораторией научно-технического творчества (ArtLab СурГУ).
«Изначально проект был, скорее, исследовательский, чем какой-то прикладной. Мне было интересно узнать, получится ли обучить модель отличать игрушечную машинку от настоящего автомобиля. Заодно и получше разобраться с тогда еще свежей архитектурой YOLOv3, главная фишка которой заключается в скорости работы», – рассказывает разработчик, подчеркивая, что это его первый проект.
Будущий дипломированный IT-специалист самостоятельно собрал датасет, обработал его для тренировки модели, чтобы обучить систему, а затем использовать для решения реальных задач. «Я собрал около 4 200 изображений, каждое разметил, указал, где на изображении находится объект, а также к какому классу он относится: игрушечная или настоящая машина. Дальше приступил к обучению модели и подбору ее размеров, но на тот момент я уперся в вычислительные мощности и время, поэтому взял самую маленькую версию, которую тем не менее обучал несколько дней, параллельно подбирая разные для нее параметры», – поделился студент Политехнического института.
Реализация этого проекта, безусловно, станет хорошим стартом и пусть он будет успешным!
Справка:
Популярная в настоящее время архитектура YOLO или You Only Look Once, которая переводится на русский язык – «ты смотришь только один раз», используется для распознавания множественных объектов на изображении. Большинство систем применяют сверточную нейронную сеть (CNN) несколько раз к разным регионам изображения, YOLO CNN смотрит на изображение только один раз. Сеть делит изображение на своеобразную сетку и предсказывает ограничительные рамки и вероятности того, что там есть искомый объект для каждого участка. YOLOv3 – это усовершенствованная версия архитектуры YOLO. Она состоит из 106 сверточных слоев, а поэтому лучше обнаруживает небольшие объекты по сравнению с ее предшественницей YOLOv2.
Автор: Дарья Вейраух