Страница 1 из 2

Хочу странного...

Добавлено: 13 окт 2019, 19:25
slant
Внезапно для себя, обнаружил, что тихой сапой уже решена одна из двух классических задач прошлого для компьютерной техники: распознавание живого голосового ввода без тренировки на конкретный голос и фонемы. Гугл с нейросетями вопрос решил - результатом можно полюбоваться в любом современном смартфоне на android. Да, оно работает через сервера гугла, в автономе качество распознания падает. Но не суть. Главное что работает, качество распознания стало очень высоким - почти 100% без всяких тренировок. Даже с моей далеко не идеальной дикцией.

Полюбовался я на это, и вдруг пришла мысля: а вот хорошо бы приспособить смартфон как дополнительную "звуковую клавиатуру" к системе на компьютере. Т.е. мышой ставишь курсор куда надо, а дальше просто диктуешь текст. Знаки препинания и спецсимволы можно ставить с нормальной клавиатуры тоже - пока пофиг.

В принципе ничего невыполнимого я тут не вижу. И интересно мне стало, а может что-то подобное уже реализовали, а я просто не в курсе? Никто с подобным не сталкивался? А то вот прямо нутром чую, что если ничего такого еще не написали, то скоро напишут...

В общем сам вопрос-предложение: если кто столкнется с чем-то подобным, напишите сюда, не поленитесь, а? Я тоже напишу если сам найду готовое решение. Интересно же. В моем детстве это была чистая фантастика пополам с мечтами. А сейчас - объективная реальность, вполне технически реализуемая...

P.S. Хочется именно на компе но через смартфон. Может есть просто приложения которые задействуют Google API напрямую с компа, но тут придется раскошелится на боле-менее приличный микрофон. А в смарте он уже есть вместе с шумодавом.

P.S.S. Вторая из тех двух классических задач - это синтез компьютером голоса неотличимого от человеческого. Пока не решена, но тоже на подходе. :)

Хочу странного...

Добавлено: 13 окт 2019, 20:20
BadBird
На винде уже давно есть голосовое управление пк и печать, но не через смартфон, а через микрофон....сам правда не юзал - не было необходимости....

Хочу странного...

Добавлено: 13 окт 2019, 20:24
asa
Может это как то подойдет WO Mic может превратить ваш телефон в микрофон для вашего компьютера. http://www.wirelessorange.com/womic/
В винде похожее реализовано в проге Laitis https://laitis.ru/
Если я правильно понял :smile:

Хочу странного...

Добавлено: 13 окт 2019, 20:48
slant
BadBird писал(а):
13 окт 2019, 20:20
На винде уже давно есть голосовое управление пк и печать
Не знаю как оно сейчас, но даже во времена запуска Win10 это было одно название. Только на английском, и с кучей ошибок. Сейчас-то может и наработали базу, но Кортана, если правильно помню, до сих пор по русски не бум-бум. :)

Хочу странного...

Добавлено: 13 окт 2019, 21:10
WWolf
Google2Ubuntu смотрел?

Хочу странного...

Добавлено: 13 окт 2019, 21:37
x230
Не по теме
slant писал(а):
13 окт 2019, 19:25
хорошо бы приспособить смартфон как дополнительную "звуковую клавиатуру"
А потом что? - Джарвед с Тони Старком? И опять спасать мир? - Ну нафиг... :beee: Я просто ручками...

Хочу странного...

Добавлено: 13 окт 2019, 21:47
Whowka
Не по теме
x230 писал(а):
13 окт 2019, 21:37
А потом что? - Джарвед с Тони Старком
Простите за "отсталость", это что-то типа: скайнета с терминатором? :smile:

Хочу странного...

Добавлено: 13 окт 2019, 23:08
x230
Не по теме
Whowka писал(а):
13 окт 2019, 21:47
что-то типа: скайнета с терминатором
Угу :joke:

Хочу странного...

Добавлено: 14 окт 2019, 09:11
abulaev2008
Может это: https://mycroft.ai/get-started/
или это: https://speechpad.ru
Есть еще ADRIAN, но это для слабовидящих

Хочу странного...

Добавлено: 18 окт 2019, 09:42
hellonet
https://speechpad.ru/
неплохо работает

Хочу странного...

Добавлено: 18 окт 2019, 21:17
vir0id
Whowka писал(а):
13 окт 2019, 21:47
скайнета с терминатором?
Да ну всё это нахрен - Сказала Сара Конор, и сделала аборт :acute:

Хочу странного...

Добавлено: 19 окт 2019, 15:02
madesta
Понимаю, когда это будут использовать люди, работающие головой. Но в отношении обычной тёти Клавы или дяди Васи лично я - категорически против. И так не умеют грамотно писать по-русски. А тут ещё и говорить понятно разучатся, рассчитывая, что их "это самое" и "как бы" система автоматически преобразует в нужные литературные обороты.

Хочу странного...

Добавлено: 19 окт 2019, 15:50
Kochegar
Сейчас многие зарабатывают переводом аудио в текст. При наличии задуманного приложения они загрустят...

Хочу странного...

Добавлено: 19 окт 2019, 15:53
symon2014
Не по теме
Kochegar писал(а):
19 окт 2019, 15:50
Сейчас многие зарабатывают переводом аудио в текст.
Русские переводчики с китайского на английский. ))

Хочу странного...

Добавлено: 19 окт 2019, 16:20
slant
madesta писал(а):
19 окт 2019, 15:02
А тут ещё и говорить понятно разучатся, рассчитывая, что их "это самое" и "как бы" система автоматически преобразует в нужные литературные обороты.
А вот хрен вам. Возможно, если поставить такую цель, можно и подобного добиться, но пока голосовой ввод наоборот - учит дисциплине речи, т.к. слова-паразиты просто добавляются в текст. И то, что без орфографических ошибок - особо не спасает. :) На текущем этапе, человек желающий диктовать текст вместо ввода с клавиатуры должен уметь говорить правильно. Т.к. понимания что именно вводится (по смыслу) у машины не добавилось, творческим подходом там не пахнет. Что скажешь - то "на бумаге" и окажется.
Я вообще думаю, это можно в качестве тренажера риторики использовать. Во всяком случае, заставляет сначала думать, а потом уже языком двигать. :) Что кстати полезно для тех, кто большую часть времени с клавиатуры общается. При печати несколько другие центры мозга работают, чем при живой речи. Если только печатать - говорить совсем не разучишься, но вот четкость и правильность речи страдать начнет, без тренировки то. :)

Хочу странного...

Добавлено: 19 окт 2019, 21:05
Kochegar
Я бы назвал это приложение просто - "машинистка". Ей диктуют, она пишет. Иногда поднимает глаза и спрашивает: - "Так и написать, сэр"?

Хочу странного...

Добавлено: 19 окт 2019, 21:09
symon2014
Я бы назвал это приложение просто - "машинистка
Я бы не спешил юродствовать на эту тему. Уже много наработано , просто не для дебилов.

Хочу странного...

Добавлено: 20 окт 2019, 20:17
KOT040188
Всё уже придумано. Kdeconnect.

Хочу странного...

Добавлено: 14 ноя 2019, 19:46
slant
KOT040188 писал(а):
20 окт 2019, 20:17
Всё уже придумано. Kdeconnect.
Еще бы ответ был чуть развернутей, и был бы он полезным. А так - глянул что речь про софт для "сопряжения телефона с компьютером" - и благополучно пропустил мимо, т.к. посчитал что речь о файлах и бекапах записной книжки.

Однако когда вчера я его таки поставил и настроил именно для этого самого - передачи файлов, облазив попутно все приложение, с удивлением обнаружил, что оно действительно может выполнять и такую функцию!
Делаем так: соединяем телефон с компьютером, разрешаем модуль удаленного управления (управление курсором на компьютере с телефона, этакий тачпад), и в этом модуле кроме курсора еще можно текст с клавиатуры телефона на компе набирать. Собственно все - осталось только "голосовую клавиатуру" активировать и диктовать тест. Действительно "давно придумано". :)

Хочу странного...

Добавлено: 14 ноя 2019, 19:51
WWolf
Не по теме
slant писал(а):
14 ноя 2019, 19:46
осталось только "голосовую клавиатуру" активировать и диктовать тест
хм... программировать голосом, а не руками? ну верх лени :-D