Специалист по голосовым технологиям

11.04.2018

Николай ХабаровРазве не странно, как иногда жизнь имитирует искусство? Просто подумайте — на протяжении десятилетий единственным местом, где мы могли видеть устройства распознавания голоса, были научно-фантастические фильмы, такие как 2001: Space Odyssey, Runner Blade, Star Trek и т. Д. если бы мы не догадались, что один день станет частью нашей повседневной жизни. И до такой степени, что мы воспринимаем их как должное и мало что делаем.

Благодаря таким технологиям, как виртуальный виртуальный помощник Apple Siri, Alexa’s Amazon или Microsoft Cortana, такие инновации вступили в новую эру развития. Они все чаще становятся естественным инструментом для взаимодействия с «умными» бытовыми объектами вокруг нас и, как ожидается, в ближайшие несколько лет будут проникать все глубже во все аспекты нашей личной и профессиональной жизни. Именно поэтому многие разработчики программного обеспечения рассматривают эту нишу как особенно перспективную и специализируются на создании такого типа технологий.

Содержание

Специалист своего дела
Мое любимое занятие
Мое образование
Мой творческий путь
Мои задачи и обязанности
Необходимые навыки и опыт
Препятствия в работе
Удовлетворение от работы
Зарплата
Мои источники информации
Мои планы на будущее
Совет будущим специалистам
О необходимых навыках

Растущий интерес к ним, в свою очередь, улучшит перспективы карьеры и поиска других профилей, таких как ученые, изучающие естественные языки. Почему? Поскольку технология становится все более сложной, она должна будет иметь более широкое (не сказать близко к человеку) понимание контекста речи со всеми его слоями смысла.

Специалист своего дела

Специалисты по спектру обычно имеют хорошие знания в области обработки звука, искусственного интеллекта и информатики. Важен также опыт работы с статистикой и ролевым моделированием. По большей части платформы на основе голосового взаимодействия написаны на C ++ и Voice XML. Однако разработка речи является лишь частью растущей сложности компьютеров, последовательной стадии их эволюции. Фактически, способность современных вычислительных систем анализировать и обрабатывать данные уже настолько велика, что они могут делать то, что несколько лет назад считалось исключительной привилегией людей. В будущем новые технологии будут интегрировать не только голосовые модели, но и все более широкий спектр человеческих возможностей для выражения, эмоций и интеллекта. Как говорится, в этой области небо — это предел, граница — небо. И, вероятно, за его пределами.

Подробнее об этой профессии рассказывает
Николай Хабаров, архитектор программного обеспечения DataArt

Николай Хабаров — архитектор программного обеспечения и старший разработчик программного обеспечения в глобальной технологической компании DataArt. Он работает в области информационных технологий уже 10 лет. Окончил «Радиотехнику» в Техническом университете Воронежа, Россия. Он имеет большой опыт работы в области технологий голосовой активации и их развертывания в различных программных и аппаратных системах, от микроконтроллеров до современных ARM, а также в приложениях конечных пользователей, облачных решениях и приложениях для Android. Особый интерес представляет передовые технологии, проекты НИОКР и внедрение инновационных подходов. Он участвует в ряде конференций и семинаров, в ходе которых он рад поделиться своим опытом и знаниями. Вдохновленный идеей.

Мое любимое занятие

Я архитектор программного обеспечения в глобальной технологической компании DataArt. Я специализируюсь в Интернете, и я также эксперт GD (разработчик Google). Конечно, это профессия с перспективой. Современный человек окружен высокотехнологичными устройствами, но для этих устройств нужны разработчики и разработчики программного обеспечения. Каждый год появляется все больше и больше разнообразных инновационных услуг и технологий, в том числе голосовой. Например, даже такие известные вещи, как автомобили, включают в себя ряд технологий, функции с голосовыми командами, автоматизированные процессы, и это невозможно без разработчиков.

Мое образование

По образованию я радиоинженер. Я окончил Технический университет в Воронеже, Россия. В то время, когда я собирался подать заявку, не так много мест, где вы могли бы изучать информатику и программирование. Вот почему я выбрал специальность, которая ближе всего к тому, что я хотел сделать. Я чрезвычайно благодарен одному из моих профессоров. Он проводил базовый курс по компьютерным навыкам, и во время первой лекции все спрашивали комнату: «Привет, расскажи мне, что ты знаешь о компьютерах». Затем он начал объяснять простые вещи и задавать вопросы, чтобы проверить уровень группы. Через 15 минут он повернулся ко мне и велел мне прекратить отвечать и замолчать. Закончив лекцию, он позвонил мне и сказал: «Вы не для этого курса, вы хотите, чтобы я научил вас индивидуально?»

Мой творческий путь

Это был очень интересный, но трудоемкий процесс. Мой отец также радиотехник, и именно он начал эту технику, когда я был ребенком — ремонтировал и разбирал устройства, глядя на их части. Когда мне было 12 лет, не было никаких смартфонов, компьютеров и всех этих вещей, которые соединяют сегодняшних подростков. Но я действительно хотел общаться с моими соседями. Мы создали частную компьютеризированную телефонную сеть, связывающую наши дома. Проводы пришли ко мне домой, где мой мультирегуляторный мини-центр работал уже несколько лет. В конце концов, все в окрестностях знали о моем технологическом и технологическом хобби, и я постоянно несли вещи, чтобы исправить. Именно в этот период мой друг принес мне книгу о Бейсике. Это был первый язык программирования, который я встречал,

Мои задачи и обязанности

Моя работа включает в себя множество различных видов деятельности — от написания кода до разработки интерфейсов программирования, архитектурных диаграмм и документации и завершения выбора технологических инструментов, которые будут использоваться для создания проекта. Например, выбирая различные услуги распознавания голоса у разных клиентов.

Даже когда я был студентом, я научился использовать математику для распознавания звуков и слов в человеческой речи. В настоящее время эта функциональность реализована на многих разных платформах. Возможно даже не только распознать слова, но и смысл всего предложения. Технологии развиваются в направлении диалога, а не только распознавания голоса.

Необходимые навыки и опыт

Необходимы навыки разработки программного обеспечения, как и в любой другой области программирования. В этом случае вам также понадобятся математические знания и знания в области обработки звука. Но с каждым годом последние две вещи не так важны, как все реализовано, и как разработчик вы просто выбираете инструмент, который вам нужен, и используйте его правильно.

Препятствия в работе

Как правило, технологии распознавания голоса в основном основаны на онлайн-интерфейсах, и при разработке аналогичной услуги она должна быть очень отзывчивой, быстрой и надежной. Однако это не всегда возможно из-за того, что в некоторых местах технология и скорость интернета не очень высоки. Никто не захочет ждать, пока компьютер «не подумает» или не справится с голосовой командой. В этом смысле особый приоритет — создание решений, которые работают быстро и надежно. Еще одной проблемой для таких технологий является широкое разнообразие языков во всем мире и их специфичность, что часто мешает технологиям распознавания голоса.

Удовлетворение от работы

Я счастлив, когда я не могу просто создать рабочий продукт, но когда он увидел , как этот продукт работает наилучшим образом и используется многими людьми , способствует каким — то образом свою работу и повседневную жизнь. Голосовая технология дает скорость — например, во время вождения, и мы хотим ввести команду в навигации. Голосовая технология все чаще входит в повседневную жизнь и в «умных» домах — системах кондиционирования воздуха, электроприборах, теперь можно управлять многими из этих вещей голосом. Я бы не сказал, что это технология, которая коренным образом изменяет нас и нашу жизнь, но это, безусловно, удобный способ взаимодействия с людьми и технологиями и облегчения нашей повседневной жизни.

Зарплата

На мой взгляд, ответ на этот вопрос зависит от ряда факторов — в основном географического положения. Стартовая зарплата может составлять несколько сотен долларов в местной компании, но она может достигать 3-5-7 тысяч лет в диапазоне от 3 до 4,5 тысяч долларов. Это вполне достижимая плата для старших разработчиков.

Мои источники информации

Как и в любой технологической профессии, и не только самым удобным, современным и важным источником информации остается Интернет и Google. Какую бы информацию мне ни понадобилась, я всегда могу найти ее там.

Мои планы на будущее

Я хотел бы сделать шаг в несколько другом направлении — заниматься лекцией, маркетингом, технологическим евангелизмом.

Совет будущим специалистам

Я бы посоветовал им следующее: не концентрируйтесь на конкретной платформе или каркасе. Изучите принципы, которые там используются. Это не затруднит вам переход от API Google Speech к IBM Watson Speed ​​to Text API, например. Я также советую людям, которые идут на такую ​​профессию, не лениться, позвольте мне прочитать как можно больше, чтобы изучить, как системы работают в глубину. Возможно, вам никогда не придется создавать систему распознавания голоса с нуля, но будет полезно знать все в целом — что можно сделать через систему, а что нет.

Еще о необходимых навыках

— Аналитическое и алгоритмическое мышление
— Хороший уровень программирования
— Хорошее знание прикладной математики и статистики
— Умение манипулировать данными
— Знание, связанное с обработкой звука

Источник — www.karieri.bg

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

«