Как написать конвертер файлов
На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы. Основой содержимого стали интервью с её близкими и друзьями. С ними я встречался лично, записывал разговор на диктофон. Дальше начиналось самое интересное. Эти записи предстояло расшифровать в текст.
Пять лет назад подобный подарок я уже делал, подруге. В 2015-м ещё не имелось достойных сервисов, способных транскрибировать аудиофайлы в текст. Сейчас технологии достигли необходимого уровня.
Делюсь подборкой соответствующих сервисов, наиболее совершенных. Trial-версия в каждом из них даёт обработать от 30 минут до 9 часов. Как правило, этого достаточно для большинства непромышленных задач. Экспорт готовой стенограммы возможен в Word и т.п. Если звук чёткий, без посторонних шумов, а люди говорят внятно, то качество расшифровки будет близко к 100%. В полученном документе останется лишь настроить стили и разбить его на абзацы.
Здесь можно бесплатно расшифровать три файла. При этом максимальная длина каждого – до трёх часов. Итого, 1 аккаунт = 9 бесплатных часов. Если у вас больше трёх файлов, но все они суммарно меньше 9-часового лимита, просто «склейте» их предварительно в аудиоредакторе. Тогда вам будет достаточно одной учётки. В противном случае на каждые три файла придётся регистрировать новый профиль.
Примечание. Во время регистрации нужно привязать банковскую карту. Если не планируете покупать платный тариф, не забудьте после транскрибации удалить её данные в Настройках. Тогда через 7 дней деньги не спишутся. Безлимитный тариф стоит от 75$ в месяц.
На каждом из этих сайтов бесплатно можно обработать запись до 30 минут. Принцип работы, и, судя по всему, движок, один и тот же. Тарифы не совсем прозрачные. В т.ч., поэтому первый сервис удобнее.
UPD 3.02.2019
3. В комментариях ещё порекомендовали данный сервис от Google:
При регистрации в любом из сервисов Google Cloud даётся 300$ на их использование (бесплатный trial). Этого хватит для перевода около 300 часов аудио в текст.
Используйте технологии XXI века для удобства и экономии времени!
Комментарий удален по просьбе пользователя
Cloud Speech-to-Text provides fast and accurate speech recognition, converting audio, either from…60 минут через гугл и 9 часов через указанный в статье сервис. Разница очевидна.
60 минут в месяц бесплатно. 300 баксов дают при первой регистрации, тариф ($0.004 / 15 seconds), после 60 минут в месяц. И того 312.5 часов бесплатно, разница действительно очевидна. Я не эксперт, но что-то мне подсказывает, что все эти сервисы используют google,amazon,ibm и это в лучшем случаи и просто перепродают тебе. ред.
Да, действительно, вы правы. Гугл в таком случае выгоднее. Спасибо за информацию!
я правильно понял, что для того, чтобы им воспользоваться, нужно создать проект, сервисный аккаунт, учетные данные (и т. д.?)?
регистрация и добавить карту ввести данные, проверять их не будут в том плане, что высылать скан паспорта не надо , а дальше да проект получить ключ и дальше и тд. Сейчас дают 300 баксов на 3 месяца, а не на год уже.
Ага, и еще, как выяснилось, нужна программа на питоне. Я не программист, нашел такую инструкцию, сделал всё по ней, но застопорился в этом месте, такую ошибку получаю:
NameError Traceback (most recent call last)
in ()
61 storage_client = storage.Client(project_id)
62 blobs = storage_client.list_blobs(bucket_name)
—-> 63 for blob in blobs:
64 print(blob.name)
65 list_blobs(bucket_name)
NameError: name 'blobs' is not defined
When it comes to conducting user research and interviews, having a written transcript of the words…"На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы"
Это же какое ЧСВ должно быть у тебя и у твоей мамы что бы такие подарки вообще дарить
Лучший подарок для мамы - это ЖУРНАЛ, сделанный своими руками, но С ПОМОЩЬЮ бесплатной программы по переводу аудио в текст!
Капец, на дворе 21 век, а тут такое, ёперный театр!
Так, ладно, шутки шутками, но скоро 8 марта, пойду доделывать газету для мамы :))))) ред.
Классная ирония про газету)) В интернете, кстати, полно услуг по созданию именных журналов в подарок. Я делал всё сам, в т.ч. вёрстку, процесс от А до Я занял 3 недели. Если нет времени, можно отдать от 10 тыс. и выше, за вас всё сделают спец. фирмы)
Уважаемый Андрей, попробуйте сделать данный подарок своей маме, жене или сестре. Именинница оценит. Вам вовсе не обязательно заказывать тираж 5 тыс. экземпляров, чтобы распространять его через магазины посторонним лицам. Достаточно одного. Таким образом ваше ЧСВ и ЧСВ вашего близкого останется на адекватном умеренном уровне.
Я бы не оценила. Но у нас с вами разные представления о жизни и нашем месте в этом мире и жизни окружающих.
Через гугл переводчик вы можете только наговорить текст. Загрузить аудиофайл для транскрибации невозможно. ред.
Комментарий удален по просьбе пользователя ред.
Можно так завести и в системную диктовку, которая будет работать прямо в Ворде и оффлайн, если это важно (на маке точно, на Win10 вроде тоже есть подобное)
Согласна но там ограничение по символам, беда, Роман
Осталось только теперь БЕСПЛАТНО раздобыть программу по переводу 4К видео в диафильмы и привет 19 век!
Спасибо!
Не понимаю, почему с этим так тухло
Вот пара сервисов есть и хорошо
А софта оффлайн нормального нет
При том что сама технология в любом свежем андроиде есть
беда лишь в том, что андроид ненужон
Пользовался таким способом расшифровать текст: заходил в гугл переводчик, запускал распознавание текста по голосу и включал на фоне, собственно, сам файл. Там в настройках микшера немного надо повозиться, чтобы все работало, но это один из самых действенных и бесплатных способов расшифровать текст.
Кстати. Для Клауд Спич Гугл сначала нужно скачать файл, а уже после загрузить его для обработки. Если файл весит много, а интернет не самый быстрый, то скачивание, а потом заливка в Клауд Спич Гугл - слишком долго. Да и в целом довольно нерационально сначала скачивать видео из интернета, а потом его обратно туда загружать.
В Тринт можно загрузить файл по прямой ссылке. Если надо расшифровать видео с известного хостинга, например, ютуба, я делаю так:
1. Копирую url нужного видео
2. Иду на savefrom, чтобы "выдернуть" прямую ссылку на видео
3. Иду на Тринт, там выбираю функцию "добавить через url"
Готово. Существенная экономия времени.
Подскажите пожалуйста, удалось удалить карту? у меня такая же проблема
Всем привет.
Поступила вот такая интересная задача - "сделать программу что бы удобно было файлы конвертировать и точно без вирусов".
Это и есть основная программа.
Далее потребовалось, что бы все это запускалось по расписанию, само решало какие файлы надо конвертировать и - внимание - отправлять в нужные чаты в аське, ой, mail.agent.
Зачем? Да лучше не спрашивайте))
Это стало, собственно, второй задачей и второй программой. Для этой второй задачи я написал бота для mail.agent и он там уже должен успешно рулить процессом, в общем.
Болталку к нему не прикручивал - хотя теперь стало интересно и болталку сделать.
Вернемся к изначальной теме теперь.
Вот так конвертер по итогу у меня сейчас выглядит:
Неказисто, но практично)
Кому лень или не хочется читать о том, как это сделано - внизу темы исходники. Можно пользоваться сразу - кому надо, могут сразу упаковать в EXE, я это делаю вот этой штукой:
Python exe packer - программа для сборки скриптов Python в exe файлы 1.1.0
Итак, для работы программы нам потребуются следующие библиотеки:
- tkinter, ttk
- os
- win32com
- pdf2image
- poppler
Вот, собственно, и сам код:
Как обычно, все основные элементы управления на форме я упаковал в класс - при дальнейшей модернизации программы это сильно облегчает жизнь.
Сам класс FormConvert выделен отдельным блоком и хорошо читается - но если у кого то возникнут вопросы, то без проблем отвечу на них.
В остальном же идея предельно проста: когда пользователь с помощью кнопок и комбобоксов выставил нужные параметры, то просто жмет кнопку "Выполнить".
Для бота я делал небольшие изменения - ему кнопка не нужна, так что он использует программу как импортируемый модуль.
Именно поэтому здесь так важно проверять, как именно запущена программа - за это отвечает код в строке:
if __name__ == '__main__':
Дословно - если программу запускает пользователь, то идет загрузка всего интерфейса и юзеру больше ни о чем думать не надо)
После нажатия заветной кнопки "Выполнить" мы стартуем функцию run_all, которая перебирает файлы по заданным параметрам и передает их в остальные функции для обработки.
Если выбран каталог - берутся все файлы с нужным расширением, если отдельные файлы - поочередно обрабатывается то, что выбрал пользователь.
Большинство преобразований можно было произвести с помощью win32com, но вот с картинками пришлось повозиться. и пилить отдельную функцию pdf_jpg.
Да, цифра в pages - это количество точек на выходе, так что вес файла можно отрегулировать под себя.
О результатах работы мы узнаем из информационного окна.
Это, собственно и все - если кому то еще, кроме меня это будет полезным, то я буду доволен))
Формат файла определяет, что вы можете с ним сделать, и какие программы могут его открыть. Вы всегда можете проверить формат, посмотрев расширение имени файла. Подумайте о каждом формате, как о другом языке, некоторые из них понятны только конкретным платформам и приложениям. Чтобы получить доступ к любому файлу, вам может попробовать преобразовать его в новый формат.
Например, то, что ваш коллега, создал текстовый файл на macOS, может не работать на вашем компьютере под управлением Windows 10. Или веб-сайт, который просит вас загрузить фотографию, может настаивать на том, что это определенный тип файла. В этом руководстве я порекомендую некоторые из лучших услуг конвертации любого файла в любой формат и дам вам несколько советов, чтобы вы никогда не застряли с неправильно закодированным файлом.
Первый шаг: проверьте свои приложения
Как и текстовые редакторы, так и программы редактирования изображений позволяют сохранять ваши изображения в виде различных типов файлов, поэтому вы можете выбрать подходящий. Экспортируйте изображение из «Фото» на macOS , например, через File и Export . Это позволит вам выбирать между форматами JPEG, PNG и TIFF .
Если вы знаете, что хотите получить доступ к определенному файлу с помощью нескольких программ, сначала вы можете сохранить файл в нескольких форматах. Конечно, у вас не всегда будет доступ к программе, которая первоначально создала файл. В этом случае вы захотите использовать программу для конвертации. Выбранная вами программа будет зависеть от типа файла, с которым вы работаете.
Для видео
Для ваших нужд конвертации видео вы не ошибетесь в выборе бесплатных программах Handbrake и VLC .
Handbrake (для Windows , MacOS и Linux ) принимает видео файлы практически из любого формата и преобразует их в любой другой популярный тип видео.
Программа проста в эксплуатации и даже позволяет выбирать из стандартных предустановленных режимов, чтобы, скажем, оптимизировать видео, которое вы конвертируете для iPhone X. Вы также можете углубиться в настройки для кодеков — точные стандарты, с помощью которых сохраняются видеофайлы. Помимо этого, Handbrake копирует видео с DVD-дисков и поддерживает субтитры и маркеры разделов в ваших конвертациях.
Не менее впечатляет, VLC Media Player (для Windows , MacOS и Linux ). Она может воспроизводить целый ряд видеоформатов, включая MPEG-4, H.264, WMV и MKV , без дополнительных плагинов. Программа также может конвертировать между широким выбором различных типов файлов. Когда программа откроется выберите «Медиа» , затем «Конвертировать/Сохранить» . Приложение попросит вас выбрать видеофайл с жесткого диска, и затем вы можете выбрать формат, на который вы хотите его изменить. Вместо записи поверх исходного файла, VLC создаст отдельную копию недавно переформатированного видео. Вы можете включать субтитры и маркеры разделов в конвертацию и даже конвертировать сразу несколько файлов.
Для изображений
Вы можете найти еще больше бесплатных программ для конвертирования ваших фотографий. Я выбрал для вас три лучших.
XnConvert (для Windows , MacOS и Linux ) позволяет изменять размеры изображений, изменять глубину цвета и даже добавлять текст при конвертации фотографий. И если вы спешите, вы можете сразу конвертировать целые партии изображений.
Также очень хороша и удобна для пользователя Adapter (для Windows и MacOS ). Чтобы начать работу, перетащите файлы поверх интерфейса приложения, выберите формат и нажмите кнопку «Конвертировать». По ходу действия вы можете изменить разрешение и качество файла. Adapter может преобразовать длинный список файлов за один раз. Помимо изображений, он также преобразует популярные форматы видео и аудиофайлов.
Если вы предпочитаете что-то, что не требует установки, то попробуйте использовать универсальный Zamzar , его можно запустить из любого веб-браузера.
Он поддерживает преобразования в более чем 1200 различных типов файлов, включая изображения, видео и аудио. Единственным недостатком является то, что вам нужно будет использовать ваш адрес электронной почты, чтобы использовать эту услугу: как только он преобразует файл, он отправляет ссылку на указанный вами адрес.
Для аудио
Некоторые из упомянутых выше приложений, таких как Zamzar и Adapter , также могут работать с аудиофайлами. Однако, если вам нужен отдельный аудио конвертер, вы можете найти множество других программ.
Также есть простой и бесплатный Free Audio Converter от Freemake (только для Windows ). С помощью этого приложения вы просто перетаскиваете аудио в окно программы, выбираете свой выходной формат из списка внизу, и ждете завершения конвертации. Он поддерживает обычные аудиоформаты, такие как MP3, AAC, WMA, OGG и FLAC .
Наконец, если вы хотите больше контролировать звук при его преобразовании, то выберите бесплатный аудиоредактор Audacity (для Windows , MacOS и Linux ). В дополнение к полному набору инструментов для редактирования, он дает вам возможность конвертировать ваши файлы между различными популярными форматами. Для этого откройте соответствующий трек, нажмите в меню «Файл» и перейдите к опции «Экспорт» .
Для документов
По сравнению с музыкальными и видеофайлами, документы кажутся относительно простыми. Но преобразование форматов документов может быть более сложным, чем кажется на первый взгляд.
Наконец, бесплатный онлайн-конвертер файлов FileZigZag может грамотно обрабатывать различные типы файлов, включая форматы Microsoft Office и PDF-файлы . Как и Zamzar , он заставляет вас указывать адрес электронной почты, чтобы получить ссылку для загрузки для преобразованного файла. Но кроме этого, он прост и удобен в использовании, и вы можете запускать его из любого окна браузера.
Что делать? Чертыхаться и искать в интернете бесплатный конвертер, который не тормозит, не просит денег и не вставляет рекламные баннеры в ваши фото и видео? Простой лайфхак избавит вас от страданий — вы сможете менять формат файла простым переименованием расширения прямо на рабочем столе.
Если вы попробуете переименовать файл прямо сейчас, вы увидите только название документа (например, «Проект123»). Тип расширения скрыт по умолчанию во всех версиях Windows. После выполнения простых манипуляций в названии всех файлов будет указан и формат («Проект123.docx»), который вы сможете свободно редактировать, как обычный текст.
Как увидеть расширение файла? Покажу на примере Windows 10. Инструкция почти не отличается от действий в других версиях этой ОС.
В открывшемся окне перейдите во вкладку «Вид» и пролистайте список «Дополнительные параметры» до конца.
Обратите внимание на ваш рабочий стол — теперь в названии каждого файла указан его формат.
На самом деле, это и не шаг вовсе, а маленький шажок. Выполните четыре простых действия:
— кликните на нужный файл. Например, «Проект123.docx»,
— нажмите F2 (или кликните на файл правой кнопкой мыши, а потом — на «Переименовать»),
— замените в названии файла «docx» на «doc» и нажмите Enter,
— нажмите Enter в возникшем диалоговом окне.
Готово! Так же поступайте с файлами других форматов, например, заменяйте «Картинку.jpg» на «Картинку.jpg». Теперь для конвертации вам не нужно пересохранять файл в программе или пользоваться сторонними сервисами.
Этот способ отлично работает для простых типов конвертации фото, аудио, видео и документов в Word. Для сложных конвертаций вроде изменений формата электронных книг (fb2, mobi и другие) в PDF придется пользоваться специальным конвертером. Также уточню, что, изменив тип файла, вы не превратите аудио в видео, а видео в текст. Расширение — это только подсказка для вашего компьютера, которая помогает ему открыть файл в нужной программе, и оно должно соответствовать его содержанию. Например, рисунок в Пэйнте не откроется в Ворде, если изменить формат.jpg на.docx.
Читайте также: