Tuband - первый в мире синхронный переводчик для видеозвонков, разрушающий языковые барьеры между людьми.
Хотим сделать возможным общение со всем миром на своем языке.
Плагин, который может быть использован с любым приложением, поддерживающим видеозвонки: Skype, Zoom, Slack и даже просто браузер. Приложение создает виртуальную звуковую карту на компьютере, в которую направляется синхронный перевод голоса собеседника, и любое приложение может использовать эту виртуальную звуковую крату.
Принципиальные отличия от аналогов (в т.ч. от опции Skype от Ms):
- поддержка любых приложений, не только Skype
- озвучка голосом самого собеседника, а не "железной леди"
- передача эмоций собеседника (т.е. полный дубляж)
- адаптация и тренировка приложения на голс и манеру общения собеседника
- дополнительные рынки для развития: автоматическая дублированная озвучка фильмов и YT-роликов
Сейчас ищем разработчиков в свой проект.
Пока план сделать MVP, показать именно реализуемость самой задачи в ограниченных условиях, с минимальным функционалом, на базе максимально готовых сервисов вроде Google Tanslate, Yandex SpeechKit, и дальше подняв инвестиции, реализовать уже на базе собственных наработок
Стоимость вычислительных мощностей так-же еще слишком высока для реализации идеи синхронного перевода, тем более - в виде плагина с невнятной монетизацией.
1. Нет технологий позволяющих реализовать
Чтобы реализовать какую именно часть или задачу проекта?
- перевод текста на лету - уже есть у Google, Yandex и очень очень многих других сервисов, в т.ч. имеющих API
- ASR - аналогично. У Яндекса уже есть API - Yandex.SpeechKit, пока не очень, но работает. На лету. Аналогичный сервис есть у Гугла, работает лучше. По цене - изучаем сейчас.
- TTS - этого добра еще больше, в том числе и различные интонации, паузы и т.д. Таких проектов достаточно много
- передача эмоций. Задача состоит из 1) считывания эмоции говорящего - эта задача технически уже решена много где, и 2) озвучивание с заданной эмоцией - эта задача прекрасно решена в Yandex SpeechKit
- имитация голоса говорящего. пока видел лабораторные поделки на эту тему, честно говоря принципиальной проблемы именно в этой части не вижу ни с точки зрения техники (тембр голоса снять - ну FFT/IFFT задачу худо-бедно решает), ни с точки зрения бизнеса (ну не сделаем - никто не умрет, не главная фича, можно просто подобрать похожий по тембру голос из синтетических)
- поддержка и понимание узких тематик, сленга итд - здесь будут очевидные проблемы. их с наскока не решить, и это большая и длинная работа, но - строго за рамками MVP.
2. Стоимость вычислительных мощностей
Это гораздо более внятный аргумент, в отличие от вашего первого. Сейчас подбиваем юнит-экономику проекта, чуть позже вернусь со своей оценкой. Но даже основываясь на публичных цифрах, по которым тарифицируют сервисы вроде Яндекса и Гугла, стоимость перевода будет меньше стоимости синхронного переводчика
3. Невнятная монетизация. Ну тут без цифр говорить не о чем. Раз вы уверенно так заявляете - представьте ваши расчеты (они же у вас есть верно?), а то пока выглядит неубедительно. Свои расчеты я вышлю заинтересовавшимся проектом людям
Ну и чтобы окончательно закрыть тему технической невозможности - аналогичный плагин уже реализован в Skype. Там есть свои ограничения, которыми мы и планируем "бить" конкурента, о них - в основном посте.
Причем тут ваш стартап? Самостоятельно создать конкурирующую технологию вам не под силу, получить финансирование под компанию полностью зависимую от АPI третьих компаний вряд-ли получится.
2. Стоимость синхронного переводчика очень высока, но он де-факто переводит, и отвечает за точность перевода.
Кто будет платить достаточно много что-бы окупить мощностЯ - за кривой и гарантированно неточный перевод робота? Развлекающиеся общением подростки? Есть-ли у них потребные вам бюджеты.
3. Монетизация невнятна, поскольку вы данный важнейший момент вовсе обошли молчанием - тогда как с меня (!) конкретные цифры попросили, нет - вы уж сами как-нить считайте, может просветление и наступит.
По остальным вопросам я уже ответил в предыдущих постах, но вы видимо их плохо прочитали.
Какие там эксперты и венчуры :) - не смешите.
Всего доброго, удачи! Проходим мимо.
1. гигантов не совсем правильно рассматривать только как конкурентов - это очень однобокий взгляд на рынок. на самом деле - они и есть главные потенциальные инвесторы подобных стартапов
2. Skype очень слаб как продукт, и вот-вот вообще сдохнет, а Zoom вообще выбрал принципиально другую стратегию развития - через плагины, таким образом это полностью ложится в концепцию поиска стратега и экзита для ангельских инвестиций
Ну и самое главное. Да, мы действительно ищем крутых и амбициозных экспертов, которые чувствуют в себе силы сделать что-то прорывное. Возможно, на этой площадке таких людей нет - ничего страшного, есть и другие площадки.
1. Представьте что Zoom уже инвестировал в 15 стартапов по синхронному переводу, в которых изначально на старте были эксперты-основатели в переводческом деле. Представьте что вероятность такого инвестирования крайне высокая и даже очевидная (с таким-то неожиданным ростом и прибылями). Есть ли у Вас шанс будучи 16-ым таким стартапом опередить все эти 15, которые стартовали уже скажем полгода назад, а Вы только ищете спецов?
2. Какая у Вас стратегия на успех - простая вера в то что найдете спецов покруче и придумаете технологию получше? Где Ваш козырный туз в рукаве?
по п.1 - дайте плиз пруфы, я не уверен что дело обстоит именно так. если вы так уверенны - значит знаете, поделитесь информацией.
по п.2 - да нет пока стратегии на успех, я исследую тему, вовлекаю людей в общение, разбираюсь. За вопросы конечно спасибо, но не надо думать, что проект может жить только в изначальной своей постановке. Из моей практики - пивоты в стартапах случаются всегда или почти всегда. На стадии идеи / pre-seed гораздо важнее команда и ее способность рождать продукт, а не собственно идея. Верю, что тему можно повернуть по-разному, и начать с чего-то более простого и приземленного. Не обязательно сразу делать онлайн синхронный переводчик, есть и другие, альтернативные применения, о них я также в описании упомянул.
по сути же вашего вопроса - проект на стадии идеи / прощупывания возможности реализации, поиска людей, которые не побоятся за него взяться.
возможно, я пойму что тема не рабочая, возможно - нет. в любом случае в свей команде я не хотел бы видеть унылых снобов, которые не представив никаких пруфов кричат "невозможно, не полетит"
Вас я не в коем случае не хотел обзывать унылым снобом. Но и продолжать дискуссию не вижу смысла - моя цель не в том, чтобы кого-то в чем-то убедить, а больше самому разобраться. Вы мне в этом не помогаете, а спорить попусту я не люблю - ценю свое время.
Еще раз извините если был некорректен.
С уважением,
Виктор
Есть, конечно, немного работ по end to end speech translation, но пока это очень далеко от реальности.
подобным функционалом, есть что то в этом.
@Mika а вы voice stream в различных кодеках переводить пробовали? такое возможно?
и потом, если бы технология уже была - зачем бы мне был нужен тимфайндинг?
и градус неприязни хорошо ощущается в ваших постах, так что давайте про хайп тут не будем.
вопрос согласен правильные, только ваши утверждения не подкреплены ничем, о чем я выше написал.
а о проекте я честно написал, что пока на уровне pre-seed, и нет готовой технологии - пока глубокое RnD идет. считаете что нет шансов - обоснуйте, не можете - ну.... может тогда проще промолчать, чем так хайпить проект?
Да, разумеется, сейчас, в эпоху ковида, есть свои вопросы открытые географией стартапа, но... имхо все решаемо
да, я соглашусь с вами, что многие из российских инвесторов очень... странные ребята. тут как и в вопросе с наймом людей нужно очень аккуратно и осторожно выбирать, не бросаться на первые попавшиеся деньги.
Инвесторы стали очень придирчивы и не очень сильно доверяют проектам с одним-двумя участниками. Если есть команда, то выбытие одного- двух человек можно компенсировать приемом новых с адекватными навыками, главное, чтобы общая идея, тренд и командный дух не были утрачены....
Но не все кто может сделать технологию имеют возможность сидеть и делать то за что не платят, они тупо загнутся с голодухи.
Вот в таком случае на сцену выходит идейный вдохновитель, который готов продать дачу, квартиру, тачки, жену и почку. Основать ООО, и платить зп архитектору, и программистам год два три.
Не получится взять архитектора в опцион, так как если архитектор имеет возможность сделать это на свои ресурсы, то ему ни кто не нужен.
Медленно, больно, но с дивидендами от которых любой приедет в ахуй.
а если на следующий день после продажи почки микрософт обьявит о запуске новой бесплатной фичи синхроного перевода в скайпе?
"поскольку создание только лишь самой технологии - это большой проект, в котором нужно много людей (в чем я лично оч сомневаюсь), то 2-3 программиста-основателя просто не потянут набрать всех нужных в команду. А я (автор) готов найти ангельские инвестиции (немалые)для того, чтобы собрать (по сути часть уговорить на опционы, часть нанять, а другую часть и то и то понемногу) любое необходимое количество людей именно для создания технологии. А только потом пойдет прототип, только потом пойдет MVP и только потом пойдет альфа бета гамма...омега-версия и наконец-то релиз.
Другими словами я (автор проекта) беру на себя все финансовые и проектные риски и именно поэтому, я претендую на равноправную долю и место в проекте.
Вот если так - тогда это уже будет серьезный разговор, но с одной оговоркой - я все равно считаю что технология - это не конечный продукт, это заглавный принцип, который как правило 1-2 программистами и создается, и уже после первого шага понятно что если набрать еще 100 программеров, то дальше доделать технологию - это просто вопрос времени.
Поэтому считаю, что предположение что для создания технологии нужна орда синьйоров и т.д. - в корне неправильное. Эта орда нужна уже на этапе превращения прототипа в технологию, а это уже step 2. А инвесторы готовы закидать вас деньгами именно на step 1 - создания прототипа, базового принципа работы, который вы сможете показать, объяснить и все сразу уже сами додумают что вложив денег получится то что надо! И если Вы сам или с партнером-программистом просто заикнетесь, что это, короче, тут накидали прототипчик и он работает - то дальше сами венчурные фонды возьмут с радостью этих 2-3 программеров под крыло и даже если они по каким-то необъямснимым причинам с деньгами не смогут собрать себе команду - в любом акселераторе им с радостью за минимальский процент все это помогут.
Не претендую на истину вообще, просто так считаю.
Вы на этапе своей эйфории можете разве что набрать под чужие деньги людей, чтобы они попробовали создать технологию. То есть поднять риски до небес и все их взять на свои плечи. Все это закончится скорее всего тем, что Google Meet первым выкатит такой перевод, и разумеется все им и будут пользоваться из-за экосистемы Гугл, которая тупо удобная, поэтому ей все и пользуются. Гугл Мит уже по-тихоньку обходит Зум именно из-за своей экосистемы. Но если Вы аж настолько смельчак чтобы потянуть такой риск потратить чужие деньги и скорее всего обламаться - то если Вам вдруг повезет, то конечно Вы войдете в IT-историю, не говоря уже про кучи денег, известности, славы и др. Готовы к такому риску? Тут или все или ничего.
Почка это всего лишь тленный орган, жизнь коротка и сегодня ты играешь мускулатурой и носишь пинджак за пару десятков американских кусков, завтра тебя зароют вместе с твоими бесценными почками.
Впрочем почки это аллегория.
Когда есть идея она как котел начинает кипеть от личной пульсации, в этом котле нужно вариться, а когда испарится вода, с радостью быть готовым поджарится и в итоге сгореть до белого пепла.
Идея и проект это война, бой в котором умереть - как мед на душу. Меня не устраивает пол шишки, есть хлеб да ладно, зато свое, немного да все лучше чем ничего, куда мне с гуглом, я человек маленький, да и так достаточно и тд.
Нет, или мир под ногой или голожопым в овраг.
Я не могу физически объять необьятное, и кидаться во все интересные проекты. Сейчас прибываю в созидании других вещей.
У меня нет достаточного количества денег, что бы начать данный проект делать. Мне нужно хотя бы 6 - 8 сеньоров с зп от которой они бы ссались по ночам.Еще потребуются в разное время приходящие лингвист, актеры, звукорежжисер, дизайнер, фронтендер и прогеры на мобилки. Это ориентировочно 2 млн долларов, причем ни на что лишнее. Все на удаленке, офис это понты корявые. И полтора года пребывания в коматозе, то есть чистая дип разработка.