Всем привет.
Ищу человека, который умеет оживлять нейросеть и обучать её. Если вас двое - без разницы.
Есть инвайт в YCombinator - но только если доказать работу идеи.
Цель - обучить нейросеть работать по принципу видеоплагина motion morph (погуглите примеры, кто не представляет что это). Первичная цель - получить нейросетку которая сможет работать с простыми геометрическими фигурами и человеческим лицом. Конечная цель - превратить это в мобильный ugc-проект. Поэтому буду рад знакомству в том числе и с мобильным разработчиком.
Со всем этим добром защищаемся перед трекером YCombinator в Москве и пакуем чемоданы в комбинатор.
Я опишу и отрисую всю механику если найдется тот, кому такое под силу, в личном порядке пришлю развернутое описание проекта. Лишь бы нашелся. Сам территориально в москве, открыт к предметному знакомству.
Потребность не в хайпе, а в создании и развитии нейросетки, работающей с видео в динамике, а не просто на уровне фильтров.
Что подразумевается под работой нейросети, какую функцию она должна выполнять?
С одной стороны (по файлу) нейросеть должна выбирать объекты на последнем кадре и стыковать с объектами на первом кадре продолжения. Что же это как не фильтрация объектов? При этом здесь озвучено: "не просто на уровне фильтров", тогда как???
К тому же не понятно, пока, будет ли ограниченный заранее заданный перечень объектов для фильтрации. В ролике, на который дана ссылка объекты однотипные (головы разных людей) и расположение - в центре экрана... А вот представленные фото можно рассматривать по разному, например, отобразим одно из фото по вертикали, тогда объекты человек и дом на последнем и первом кадре будут в разных местах. Как такие ситуации будут обрабатываться? Мало вводных...
Под фильтрами я подразумевал визуальные эффекты, которые применяются в Призма/Артисто и т.д. НС должна же создавать видеоэффект motionmorph, при соединении двух видеофайлов - как ты правильно написал, брать/определять объекты в последней секунде первого видеоролика и соотносить их с объектами второго видеоролика, соединяя таким образом два файла в один.
Касательно ограничения перечня объектов для определения НС - ограничивать не хочется ничего, но начать в любом случае нужно с малого. В идеале сеть должна определять хорошо крупные объекты простой формы (дома, машины), людей в любом кадрировании(голову, полтела или всего человека целиком), и животных(это вероятно сложнее всего). При этом отраженное видео или нет, не должно иметь значения в целом.
Цена вопроса? И самое важное - сроки?