Страница 1 из 2
Хочу странного...
Добавлено: 13 окт 2019, 19:25
slant
Внезапно для себя, обнаружил, что тихой сапой уже решена одна из двух классических задач прошлого для компьютерной техники: распознавание живого голосового ввода без тренировки на конкретный голос и фонемы. Гугл с нейросетями вопрос решил - результатом можно полюбоваться в любом современном смартфоне на android. Да, оно работает через сервера гугла, в автономе качество распознания падает. Но не суть. Главное что работает, качество распознания стало очень высоким - почти 100% без всяких тренировок. Даже с моей далеко не идеальной дикцией.
Полюбовался я на это, и вдруг пришла мысля: а вот хорошо бы приспособить смартфон как дополнительную "звуковую клавиатуру" к системе на компьютере. Т.е. мышой ставишь курсор куда надо, а дальше просто диктуешь текст. Знаки препинания и спецсимволы можно ставить с нормальной клавиатуры тоже - пока пофиг.
В принципе ничего невыполнимого я тут не вижу. И интересно мне стало, а может что-то подобное уже реализовали, а я просто не в курсе? Никто с подобным не сталкивался? А то вот прямо нутром чую, что если ничего такого еще не написали, то скоро напишут...
В общем сам вопрос-предложение: если кто столкнется с чем-то подобным, напишите сюда, не поленитесь, а? Я тоже напишу если сам найду готовое решение. Интересно же. В моем детстве это была чистая фантастика пополам с мечтами. А сейчас - объективная реальность, вполне технически реализуемая...
P.S. Хочется именно на компе но через смартфон. Может есть просто приложения которые задействуют Google API напрямую с компа, но тут придется раскошелится на боле-менее приличный микрофон. А в смарте он уже есть вместе с шумодавом.
P.S.S. Вторая из тех двух классических задач - это синтез компьютером голоса неотличимого от человеческого. Пока не решена, но тоже на подходе.

Хочу странного...
Добавлено: 13 окт 2019, 20:20
BadBird
На винде уже давно есть голосовое управление пк и печать, но не через смартфон, а через микрофон....сам правда не юзал - не было необходимости....
Хочу странного...
Добавлено: 13 окт 2019, 20:24
asa
Может это как то подойдет WO Mic может превратить ваш телефон в микрофон для вашего компьютера.
http://www.wirelessorange.com/womic/
В винде похожее реализовано в проге Laitis
https://laitis.ru/
Если я правильно понял

Хочу странного...
Добавлено: 13 окт 2019, 20:48
slant
BadBird писал(а): ↑13 окт 2019, 20:20
На винде уже давно есть голосовое управление пк и печать
Не знаю как оно сейчас, но даже во времена запуска Win10 это было одно название. Только на английском, и с кучей ошибок. Сейчас-то может и наработали базу, но Кортана, если правильно помню, до сих пор по русски не бум-бум.

Хочу странного...
Добавлено: 13 окт 2019, 21:10
WWolf
Google2Ubuntu смотрел?
Хочу странного...
Добавлено: 13 окт 2019, 21:37
x230
Не по теме
slant писал(а): ↑13 окт 2019, 19:25
хорошо бы приспособить смартфон как дополнительную "звуковую клавиатуру"
А потом что? - Джарвед с Тони Старком? И опять спасать мир? - Ну нафиг...

Я просто ручками...
Хочу странного...
Добавлено: 13 окт 2019, 21:47
Whowka
Не по теме
x230 писал(а): ↑13 окт 2019, 21:37
А потом что? - Джарвед с Тони Старком
Простите за "отсталость", это что-то типа: скайнета с терминатором?
Хочу странного...
Добавлено: 13 окт 2019, 23:08
x230
Не по теме
Whowka писал(а): ↑13 окт 2019, 21:47
что-то типа: скайнета с терминатором
Угу
Хочу странного...
Добавлено: 14 окт 2019, 09:11
abulaev2008
Может это:
https://mycroft.ai/get-started/
или это:
https://speechpad.ru
Есть еще ADRIAN, но это для слабовидящих
Хочу странного...
Добавлено: 18 окт 2019, 09:42
hellonet
Хочу странного...
Добавлено: 18 окт 2019, 21:17
vir0id
Whowka писал(а): ↑13 окт 2019, 21:47
скайнета с терминатором?
Да ну всё это нахрен - Сказала Сара Конор, и сделала аборт

Хочу странного...
Добавлено: 19 окт 2019, 15:02
madesta
Понимаю, когда это будут использовать люди, работающие головой. Но в отношении обычной тёти Клавы или дяди Васи лично я - категорически против. И так не умеют грамотно писать по-русски. А тут ещё и говорить понятно разучатся, рассчитывая, что их "это самое" и "как бы" система автоматически преобразует в нужные литературные обороты.
Хочу странного...
Добавлено: 19 окт 2019, 15:50
Kochegar
Сейчас многие зарабатывают переводом аудио в текст. При наличии задуманного приложения они загрустят...
Хочу странного...
Добавлено: 19 окт 2019, 15:53
symon2014
Не по теме
Kochegar писал(а): ↑19 окт 2019, 15:50
Сейчас многие зарабатывают переводом аудио в текст.
Русские переводчики с китайского на английский. ))
Хочу странного...
Добавлено: 19 окт 2019, 16:20
slant
madesta писал(а): ↑19 окт 2019, 15:02
А тут ещё и говорить понятно разучатся, рассчитывая, что их "это самое" и "как бы" система автоматически преобразует в нужные литературные обороты.
А вот хрен вам. Возможно, если поставить такую цель, можно и подобного добиться, но пока голосовой ввод наоборот - учит дисциплине речи, т.к. слова-паразиты просто добавляются в текст. И то, что без орфографических ошибок - особо не спасает.

На текущем этапе, человек желающий диктовать текст вместо ввода с клавиатуры должен уметь говорить правильно. Т.к. понимания что именно вводится (по смыслу) у машины не добавилось, творческим подходом там не пахнет. Что скажешь - то "на бумаге" и окажется.
Я вообще думаю, это можно в качестве тренажера риторики использовать. Во всяком случае, заставляет сначала думать, а потом уже языком двигать.

Что кстати полезно для тех, кто большую часть времени с клавиатуры общается. При печати несколько другие центры мозга работают, чем при живой речи. Если только печатать - говорить совсем не разучишься, но вот четкость и правильность речи страдать начнет, без тренировки то.

Хочу странного...
Добавлено: 19 окт 2019, 21:05
Kochegar
Я бы назвал это приложение просто - "машинистка". Ей диктуют, она пишет. Иногда поднимает глаза и спрашивает: - "Так и написать, сэр"?
Хочу странного...
Добавлено: 19 окт 2019, 21:09
symon2014
Я бы назвал это приложение просто - "машинистка
Я бы не спешил юродствовать на эту тему. Уже много наработано , просто не для дебилов.
Хочу странного...
Добавлено: 20 окт 2019, 20:17
KOT040188
Всё уже придумано. Kdeconnect.
Хочу странного...
Добавлено: 14 ноя 2019, 19:46
slant
KOT040188 писал(а): ↑20 окт 2019, 20:17
Всё уже придумано. Kdeconnect.
Еще бы ответ был чуть развернутей, и был бы он полезным. А так - глянул что речь про софт для "сопряжения телефона с компьютером" - и благополучно пропустил мимо, т.к. посчитал что речь о файлах и бекапах записной книжки.
Однако когда вчера я его таки поставил и настроил именно для этого самого - передачи файлов, облазив попутно все приложение, с удивлением обнаружил, что оно действительно может выполнять и такую функцию!
Делаем так: соединяем телефон с компьютером, разрешаем модуль удаленного управления (управление курсором на компьютере с телефона, этакий тачпад), и в этом модуле кроме курсора еще можно текст с клавиатуры телефона на компе набирать. Собственно все - осталось только "голосовую клавиатуру" активировать и диктовать тест. Действительно "давно придумано".

Хочу странного...
Добавлено: 14 ноя 2019, 19:51
WWolf
Не по теме
slant писал(а): ↑14 ноя 2019, 19:46
осталось только "голосовую клавиатуру" активировать и диктовать тест
хм... программировать голосом, а не руками? ну верх лени
