Смарт аудиоплатформа ESP32-LyraTD-MSC
24 мая 2019
ESP32-LyraTD-MSC– одна из аппаратных платформ компании Expressif для аудиоприложений (Рис. 1). Она представляет собой решение для акустического эхоподавления (AEC), поддерживающее распознавание голоса, пробуждение от голоса в ближней и дальней зоне. Аудиофайлы в формате AAC, FLAC, OPUS и OGG могут быть декодированы и выведены без потери качества. Изделие также поддерживает подключение к Baidu DuerOS и Amazon AVS (Alexa Voice Service - Голосовой сервис Alexa). Платформа разработана для приложений искусственного интеллекта и пр.
ESP32-LyraTD-MSC основана на ESP32-WROVER-B, комбинированном BT/BLE/Wi-Fi модуле и цифровом сигнальном процессоре (DSP). Для снижения шума, эхоподавления и прочего используется DSP совместно с матрицей, состоящей из трех микрофонов. Изделие ESP32-LyraTD-MSC интегрировано с периферийными устройствами и состоит из двух отладочных плат (Рис. 2). Верхняя плата в основном состоит из матрицы микрофонов, функциональных кнопок и светодиодных индикаторов. Нижняя плата интегрирована с модулями управления питанием, Wi-Fi и аудио.
Рис. 1. Отладочная платформа ESP32-LyraTD-MSC
Рис. 2. Изделие ESP32-LyraTD-MSC состоит из двух отладочных плат
Рис. 3. Компоненты нижней платы (A) платформы ESP32-LyraTD-MSC Ver. 2.2
Рис. 4. Компоненты верхней платы (B) платформы ESP32-LyraTD-MSC Ver. 2.2
Рис. 5. Структурная схема изделия ESP32-LyraTD-MSC
Аппаратное обеспечение платформы включает в себя (Рис. 3, Рис. 4):
- Микросхему цифрового сигнального процессора (DSP);
- Три цифровых микрофона, которые поддерживают передачу голоса в дальней зоне;
- 2 х 3 Вт выхода для динамиков;
- Слот для карты MicroSD (1 линия или 4 линии);
- Двенадцать светодиодов с индивидуальным управлением, которые распределены по краю круглой платы;
- Шесть функциональных кнопок, функции которых могут быть назначены пользователем;
- Несколько интерфейсных портов: I2S, I2C, SPI и JTAG;
- Микросхему USB-UART моста;
- Схему управления зарядом Li-ion батареи.
Структурная схема изделия ESP32-LyraTD-MSC представлена на Рис. 5. Краткое описание ключевых компонентов изделия ESP32-LyraTD-MSC
- Модуль ESP32-WROVER-B – Модуль ESP32-WROVER-B содержит микросхему ESP32-D0WD для обеспечения Wi-Fi /BT/BLE подключений и эффективной обработки данных. Он также интегрирует 32 Мбит SPI флэш-памяти и 64 Мбит PSRAM для гибкого хранения данных. Это мощный микроконтроллерный Wi-Fi + BT + BLE модуль, предназначенный для широкого спектра приложений - от маломощных сенсорных сетей до самых сложных задач, таких как кодирование голоса, потоковая передача музыки и декодирование MP3.
- Микросхема DSP – Микросхема цифрового сигнального процессора ZL38063 используется для приложений автоматического распознавания речи (ASR). Чип захватывает аудиоданные от внешней матрицы микрофонов и выходов аудиосигналов через порт цифро-аналогового преобразователя (ЦАП).
- Выход для наушников – Выходное гнездо для подключения наушников с разъемом стерео 3.5 мм.
Примечание: Разъем может использоваться с гарнитурами мобильных телефонов, и совместим только со стандартными гарнитурами OMPT. Он работает с гарнитурами CTIA. Пожалуйста, см. аудиоразъемы телефонов в Википедии.
- Выход левого динамика – Выходной разъем для подключения 4 Ом динамика. Выводы разъема имеют стандартный шаг 2.54 мм.
- Выход правого динамика – Выходной разъем для подключения 4 Ом динамика. Выводы разъема имеют стандартный шаг 2.54 мм.
- Порт USB-UART (CP2102N) – Функционирует как коммуникационный интерфейс между ПК и модулем ESP32-WROVER-B.
- USB порт питания – Обеспечивает плату питанием.
- Светодиоды режимов Ожидания/ Зарядки – Зеленый светодиод режима Ожидания индицирует, что питание было приложено к порту Micro USB. Красный светодиод зарядки индицирует, что батарея, подключенная к разъему аккумулятора, заряжается.
- Выключатель питания – Перевод рычажка выключателя питания в правое положение включает плату, в левое положение - выключает.
- Светодиод питания – Красный светодиод индицирует, что питание включено.
- Кнопки Загрузки/Сброса – Загрузка: удерживание кнопки Загрузки (Boot) и мгновенное нажатие кнопки Cброса (Reset) инициирует режим загрузки прошивки. После этого пользователь может загрузить прошивку через последовательный порт.
- Сброс: нажатие только этой кнопки сбрасывает систему.
Дополнительно:
Порт I2S – Шина I2S передает аудиоданные между ESP32 и DSP.
Порт I2C/SPI:
ESP32, в качестве мастера I2C, может получать доступ к ведомым устройствам через шину I2C.
ESP32, в качестве мастера SPI, может обращаться к DSP для чтения / записи данных через шину SPI.
Порт JTAG – Стандартный интерфейс JTAG. Он совместим с платой программирования ESP32 и поддерживает функции отладки.
Аудио драйвер – аудиоусилитель мощности, который передает аудиосигналы от DSP к внешним громкоговорителям.
DC-DC повышающий преобразователь – Работает на фиксированной частоте преобразования. Питает аудио драйвер.
Порт программирования – Интерфейс программирования и отладки ESP32, совместимый с платой программирования ESP32.
Для работы с ESP32-LyraTD-MSC необходимо подготовить программное обеспечение.
Так, например, для настройки работы с DuerOS необходимо:
1.Для загрузки прошивки в плату скачать Flash Download Tool
2.Чтобы использовать функциональность SmartConfig и настроить сеть для ESP32-LyraTD-MSC, необходимо загрузить либо IOT Espressif для Android APK, либо ESP-TOUCH для iOS IPA с Espressif Apps
3.Используйте инструмент отладки, который подходит для вашей среды разработки, такой как Xshell, ССКОМ и др.
Дополнительно к ESP32-LyraTD-MSC понадобится ПК с ОС Windows (рекомендуемая ОС), два Micro USB кабеля (один для питания через USB), громкоговоритель.
Приведем пример работы интерактивной функции распознавание голоса.
Когда ESP32-LyraTD-MSC подключен к DuerOS, ESP32 поддерживает в качестве пробуждающей фразы слово «Alexa». Если произнести слово «Alexa», то это вызовет следующий ответ со стороны платы на китайском: «nin hao you shen me fen fu» (что означает: «Привет! Чем я могу помочь?»). Пользователи могут общаться с платой и управлять ею для воспроизведения песен и новостей или выполнять другие подобные голосовые взаимодействия.
Задайте следующий вопрос на китайском языке: «tian qi zen me yang» (что означает «как погода?»). Плата ответит по-китайски: «Цзинь тянь инь чжуань дуо юнь» (что означает «сегодня пасмурно, облачно»).
Подробные инструкции по работе с изделием изложены в соответствующих документах на сайте Espressif.
Отличительные особенности:
-Wi-Fi/BT/BLE микроконтроллерный модуль ESP32-WROVER-B:
-Двухъядерный микропроцессор Xtensa® 32-bit LX6;
-11 b/g/n (802.11n до 150 Mbps);
-4 GHz - 2.5 GHz;
-Bluetooth v2 BR/EDR и BLE спецификации;
-Интерфейсы SD card, UART, SPI, SDIO, I2C, LED PWM, Motor PWM, I 2S, IR, счетчик импульсов, GPIO, емкостной сенсорный датчик, ADC, DAC;
-Встроенный датчик Холла;
-Интегрированная внешняя SPI Flash память 4 МБ;
-Интегрированная внешняя PSRAM 8 МБ;
-Цифровой сигнальный процессор (DSP);
-Три цифровых микрофона;
-2 выхода для громкоговорителей до 3 Вт каждый;
-Выход для наушников;
-Слот для micro SD карты;
-12 индивидуально управляемых светодиодов, расположенных по краю круглой платы;
-6 пользовательских кнопок;
-Порты I2S, I2C, SPIи JTAG;
-USB-UART мост CP2102N;
-Схема управления зарядом Li-Ion батареи;
-Акустическое эхоподавление;
-Поддержка распознавания голоса;
-Пробуждение от голоса в ближней и дальней зоне;
-Аудиофайлы в формате AAC, FLAC, OPUS и OGG могут быть декодированы и выведены без потери качества;
-Поддержка подключения к Baidu DuerOS и Amazon AVS (Alexa Voice Service);
-Конструктивно изделие состоит из двух отладочных плат;
-Напряжение питания 5 В через micro USB Power Port (либо от Li-Ion аккумулятора).
Источник
Телефон: +7 (495) 234-0110
Москва, ул. Краснопролетарская, д. 16, подъезд No.5
Тел.: +7 (495) 234-0110
Факс: +7 (495) 956-3346
E-mail: sales@s-ekomplekt.ru