Форум программистов, компьютерный форум, киберфорум
Garry Galler
Войти
Регистрация
Восстановить пароль
Карта форума Блоги Сообщество Поиск Заказать работу  
Рейтинг: 4.00. Голосов: 4.

Новый онлайн переводчик на старом API яндекса

Запись от Garry Galler размещена 23.03.2021 в 00:33
Обновил(-а) Garry Galler 23.03.2021 в 16:49

Fast Translator

C августа 2020-го яндекс переводчик на API v1.5 перестал выдавать новые бесплатные ключи, а старые перестали работать.

Немного подумав, я написал свой web-сервис, который подключается к самой старой версии API яндекса и дает возможность получать переводы как и прежде - бесплатно.

Да, у него тоже есть свои ограничения; некоторые из которых (объем передачи за один запрос) - технически решаемы, некоторые упираются в хостинг и сам яндекс.

Сейчас (начиная с нового года) через сервис переведено как минимум 100 млн. символов(не считая того, что я переводил на тестах в локальном режиме).

Сервис имеет очень простое и хорошо документированное API, возможности которого демонстрируются ниже.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
import time
import os
import requests
from pprint import pprint
 
APP_DIR  =  os.path.dirname(__file__)
 
headers= {}
 
 
FILE_TO_TEXT_URL = "https://fasttranslator.herokuapp.com/api/v1/file/to/text"
FILE_TO_HTML_URL = "https://fasttranslator.herokuapp.com/api/v1/file/to/html"
FILE_TO_DOCX_URL = "https://fasttranslator.herokuapp.com/api/v1/file/to/docx"
 
TEXT_TO_TEXT_URL = "https://fasttranslator.herokuapp.com/api/v1/text/to/text"
TEXT_TO_HTML_URL = "https://fasttranslator.herokuapp.com/api/v1/text/to/html"
 
HTML_TO_HTML_URL = "https://fasttranslator.herokuapp.com/api/v1/html/to/html"
 
 
 
print("---TEXT_TO_TEXT---")
 
text = "текст для перевода"
data = {"lang": "ru-uk", "as": "json", "source": text}
resp = requests.post(TEXT_TO_TEXT_URL, data=data, headers=headers)
pprint(resp.json())
 
time.sleep(1)
print("---HTML_TO_TEXT---")
 
html = "<div>text for translation<div>"
data = {"lang": "en-ru", "as": "json", "source": html}
resp = requests.post(HTML_TO_HTML_URL, data=data, headers=headers)
pprint(resp.json())
 
 
time.sleep(1)
print("---FILE_TO_TEXT---")
 
# передача файла как multipart/form-data
filename = "python_1251.txt"
filepath = os.path.join(APP_DIR, filename) # ваш файл на диске;
files =  {"file": (
    filename, 
    open(filepath, "rb"), 
    "text/plain; charset=windows-1251")   # в заголовке Content-Type нужно указать исходную кодировку, иначе она будет предполагаться как utf-8
}
data = {"lang": "en-ru", "as": "file"} # значение "file" означает что файл возвращается как attachment, так же можно указать "raw", что будет означать возврат файла просто как binary data.
resp = requests.post(FILE_TO_TEXT_URL, data=data, files=files, headers=headers)
pprint(resp.headers) 
print(resp.content.decode("utf-8"))  # кодировка возврата всегда utf-8

В ответ мы получим либо json, либо бинарные данные, если посылали файл.
Код:
---TEXT_TO_TEXT---
{'data': 'текст для перекладу',
 'lang': 'ru-uk',
 'message': 'OK',
 'mime_type': 'text/plain',
 'src_size': 18,
 'status': 200}
---HTML_TO_TEXT---
{'data': '<div>текст для перевода<div>',
 'lang': 'en-ru',
 'message': 'OK',
 'mime_type': 'text/html',
 'src_size': 30,
 'status': 200}
---FILE_TO_TEXT---
{
    "Connection": "keep-alive",
    "Server": "nginx",
    "Date": "Tue, 23 Mar 2021 13:36:42 GMT",
    "Content-Type": "text/plain; charset=UTF-8",
    "Transfer-Encoding": "chunked",
    "Content-Disposition": "attachment; filename=\"python_1251.txt\"",
    "Content-Encoding": "gzip",
    "Via": "1.1 vegur"
}

основная информация¶
Что такое Python?
Python-это интерпретируемый, интерактивный, объектно-ориентированный язык программирования. Он включает в себя модули, исключения, динамическую типизацию, динамические типы данных очень высокого уровня и классы. Он поддерживает несколько парадигм программирования, выходящих за рамки объектно-ориенти
рованного программирования, таких как процедурное и функциональное программирование. Python сочетает в себе замечательную мощь с очень четким синтаксисом. Он имеет интерфейсы ко многим системным вызовам и библиотекам, а также к различным оконным системам и расширяется на C или C++. Он также может бы
ть использован в качестве языка расширения для приложений, которые нуждаются в программируемом интерфейсе. Наконец, Python переносим: он работает на многих вариантах Unix, включая Linux и macOS, а также на Windows.

Чтобы узнать больше, начните с Учебника по Python. Руководство для начинающих по Python содержит ссылки на другие вводные учебные пособия и ресурсы для изучения Python.
Это далеко не все доступные API. Подробную информацию нужно смотреть непосредственно в документации сервиса, откуда можно выполнить тестовые запросы.

Разумеется, я в курсе про существование библиотек на этом же самом yandex API как в Python, так и PHP (возможно, и в JS и где-то еще). Но все они не дотягивают до более-менее промышленного решения.
Да, и этот сервис тоже пока нельзя назвать таковым (ресурсы хостинга ограничивают возможности масштабирования), но все-таки он уже где-то рядом с ним... Пользователи, которым требуется переводить по 10-30 млн. символам за день, вполне успешно его используют.


На текущий момент на nginx выставлен довольно жесткий лимит на число запросов и в самом приложении - на число символов для перевода на каждом API.
Позднее он будет смягчен, особенно для ручного ввода файлов через формочки.

Однако, для полностью безлимитного доступа существует другая ветка API требующая отсылки JWT токена в заголовках:
Python
1
headers= {"Authorization": f"Bearer {token}"}
P.S. Сервис написан не на PHP или Python :-)
P.P.S. Дизайн мой, поэтому ругать бесполезно, но можно дать советы :-)
Размещено в Без категории
Показов 13824 Комментарии 6
Всего комментариев 6
Комментарии
  1. Старый комментарий
    Аватар для Welemir1

    крутая вещь, попробовал, всячески приветствую!
    Запись от Welemir1 размещена 23.03.2021 в 11:04 Welemir1 вне форума
  2. Старый комментарий
    Аватар для Avazart
    Python
    1
    2
    3
    4
    5
    6
    7
    8
    
    FILE_TO_TEXT_URL = "https://fasttranslator.herokuapp.com/api/v1/file/to/text"
    FILE_TO_HTML_URL = "https://fasttranslator.herokuapp.com/api/v1/file/to/html"
    FILE_TO_DOCX_URL = "https://fasttranslator.herokuapp.com/api/v1/file/to/docx"
     
    TEXT_TO_TEXT_URL = "https://fasttranslator.herokuapp.com/api/v1/text/to/text"
    TEXT_TO_HTML_URL = "https://fasttranslator.herokuapp.com/api/v1/text/to/html"
     
    HTML_TO_HTML_URL = "https://fasttranslator.herokuapp.com/api/v1/html/to/html"
    Разве тут не напрашивается dict ? Или вообще json конфиг файл
    Запись от Avazart размещена 23.03.2021 в 12:13 Avazart вне форума
  3. Старый комментарий
    Avazart
    Ну это же просто минимальный пример обращения к API, который в любом случае при реальном применении потребует и проверок на статус ответа и try except и т.д. А уж как программист захочет это все реализовать - зависит от него.
    Я специально не стал здесь ничего усложнять, чтобы это было понятно даже тем, кто не знает Python.
    Запись от Garry Galler размещена 23.03.2021 в 12:37 Garry Galler вне форума
  4. Старый комментарий
    Цитата:
    Сообщение от Welemir1 Просмотреть комментарий

    крутая вещь, попробовал, всячески приветствую!
    Если понадобится безлимитный токен - обращайся, выдам без вопросов как хорошему знакомому :-)
    Запись от Garry Galler размещена 23.03.2021 в 12:40 Garry Galler вне форума
  5. Старый комментарий
    Аватар для Avazart
    Цитата:
    Я специально не стал здесь ничего усложнять, чтобы это было понятно даже тем, кто не знает Python.
    И непонятнее для тех кто знает Python ? Странная дискриминация.
    Запись от Avazart размещена 23.03.2021 в 14:55 Avazart вне форума
    Обновил(-а) Avazart 23.03.2021 в 15:02
  6. Старый комментарий
    Всё? Не работает больше? (503)
    Запись от IlyaT79 размещена 06.11.2023 в 13:47 IlyaT79 вне форума
 
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru