in

Как происходит создание приложение для транскрипции и перевода речи.

В этом руководстве вы узнаете, как использовать виджет Streamlit st.audio_input для записи звука с помощью микрофона устройства и объединить его с моделью OpenAI Whisper для расшифровки и перевода аудио в английский текст

{"remix_data":[],"remix_entry_point":"challenges","source_tags":["local"],"origin":"unknown","total_draw_time":0,"total_draw_actions":0,"layers_used":0,"brushes_used":0,"photos_added":0,"total_editor_actions":{},"tools_used":{"remove":1},"is_sticker":false,"edited_since_last_sticker_save":true,"containsFTESticker":false}

В последствии расшифрованный контент можно будет загрузить в виде файла .txt.

OpenAI API предоставляет две конечные точки:

  • Транскрипции
  • Переводы

Что такое Whisper

Whisper — это обученная нейронная сеть с открытым исходным кодом, которая по надёжности и точности распознавания английской речи приближается к уровню человека.

OpenAI API предоставляет две конечные точки:

  • Транскрипции
  • Переводы

Что такое Streamlit

Согласно официальному сайту, Streamlit — это более быстрый способ создания приложений для работы с данными и обмена ими. Это библиотека Python с открытым исходным кодом, которая помогает создавать веб-приложения для обмена аналитическими результатами, создания сложных интерактивных интерфейсов и работы с новыми моделями машинного обучения.

Streamlit — лучший выбор для разработчиков на Python, потому что у него есть встроенные и удобные методы: от ввода пользовательских данных, таких как текст, числа и даты, до отображения интерактивных графиков с помощью самых популярных и мощных графических библиотек Python.

Установка Streamlit

Чтобы запустить любое приложение Streamlit, сначала необходимо установить Streamlit с помощью команды:

pip install streamlit

Установка других библиотек

Поскольку мы работаем с преобразованием аудио в текст, нам нужно надёжно хранить переменные среды.

pip install openai python-dotenv

Создание переменной окружения

Создайте новый файл в корневом каталоге проекта и назовите его .env.

Вставьте в свой OpenAI ключ API:

.env

OPENAI_API_KEY="sk-..."

Создание приложения

В вашем каталоге создайте этот файл streamlit_app.py со всем кодом Python для расшифровки и перевода нашего аудио и вывода полученного текста.

Чтобы инициализировать экземпляр клиента OpenAI, скопируйте и вставьте этот код:

streamlit_app.py

import os
from dotenv import load_dotenv
from openai import OpenAI

load_dotenv()

api_key = os.getenv('OPENAI_API_KEY')

client = OpenAI()

Блок кода подключается, считывает закрытый ключ из файла .env и подтверждает, что мы авторизованы как пользователь.

P.S.: Использование API OpenAI не является бесплатным, так как для использования сервиса необходимо приобрести некоторое количество кредитов.

What do you think?

Newbie

Written by Павел

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

GIPHY App Key not set. Please check settings

    Конкурс по написанию доказательств RareSkills Zero Knowledge