Doctranslate.io

API ການແປພາສາ PDF ພາສາອັງກິດເປັນຮິນດີ: ໄວ ແລະ ຮັກສາຮູບແບບໄດ້ດີ

Đăng bởi

vào

ສິ່ງທ້າທາຍທີ່ສັບສົນຂອງການແປພາສາ PDF ດ້ວຍໂປຣແກຣມ

ໃນຕະຫຼາດໂລກປັດຈຸບັນ, ການເຂົ້າເຖິງກຸ່ມເປົ້າໝາຍທີ່ຫຼາກຫຼາຍຮຽກຮ້ອງໃຫ້ມີການທ້ອງຖິ່ນເນື້ອຫາ, ແລະ ປະຊາກອນທີ່ເວົ້າພາສາຮິນດີສະແດງເຖິງໂອກາດອັນໃຫຍ່ຫຼວງ.
ນັກພັດທະນາມັກຈະຖືກມອບໝາຍໃຫ້ເຮັດການແປເອກະສານແບບອັດຕະໂນມັດ, ໂດຍທີ່ PDF ເປັນໜຶ່ງໃນຮູບແບບທີ່ພົບເຫັນທົ່ວໄປທີ່ສຸດ ແຕ່ຍັງເປັນຮູບແບບທີ່ຫຍຸ້ງຍາກທີ່ສຸດ.
ຄູ່ມືນີ້ໃຫ້ຄໍາແນະນໍາທີ່ຄົບຖ້ວນສໍາລັບການນໍາໃຊ້ API ການແປພາສາ PDF ພາສາອັງກິດເປັນຮິນດີ, ເຊິ່ງເປັນເຄື່ອງມືທີ່ມີປະສິດທິພາບທີ່ຖືກອອກແບບມາເພື່ອເອົາຊະນະອຸປະສັກທາງດ້ານເຕັກນິກທີ່ສໍາຄັນທີ່ກ່ຽວຂ້ອງກັບຂະບວນການນີ້.

ຄວາມຫຍຸ້ງຍາກຕົ້ນຕໍຂອງການແປພາສາ PDF ແມ່ນມາຈາກການອອກແບບຂອງຮູບແບບ, ເຊິ່ງໃຫ້ຄວາມສໍາຄັນຕໍ່ຮູບລັກສະນະພາບທີ່ສອດຄ່ອງກັນໃນທົ່ວທຸກແພລັດຟອມຫຼາຍກວ່າຄວາມງ່າຍຂອງການແກ້ໄຂເນື້ອຫາ.
ຕ່າງຈາກໄຟລ໌ຂໍ້ຄວາມທໍາມະດາ, ເນື້ອໃນຂອງ PDF ບໍ່ໄດ້ຖືກເກັບຮັກສາໄວ້ຕາມລໍາດັບ, ເຮັດໃຫ້ການສະກັດຂໍ້ຄວາມເປັນວຽກທີ່ບໍ່ແມ່ນເລື່ອງເລັກນ້ອຍ.
ນອກຈາກນັ້ນ, ຂະບວນການດັ່ງກ່າວມີຄວາມກ່ຽວຂ້ອງຫຼາຍກວ່າພຽງແຕ່ການປ່ຽນຄໍາສັບເທົ່ານັ້ນ; ມັນຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈຢ່າງເລິກເຊິ່ງກ່ຽວກັບໂຄງສ້າງໄຟລ໌, ການເຂົ້າລະຫັດຂໍ້ຄວາມ, ແລະ ການຮັກສາຮູບແບບເພື່ອໃຫ້ປະສົບຜົນສໍາເລັດ.

ສິ່ງທ້າທາຍກ່ຽວກັບການເຂົ້າລະຫັດຕົວອັກສອນ

ການເຂົ້າລະຫັດຕົວອັກສອນແມ່ນອຸປະສັກພື້ນຖານໃນທຸກຂັ້ນຕອນການແປພາສາ, ໂດຍສະເພາະໃນເວລາທີ່ປ່ຽນຈາກຕົວອັກສອນລາຕິນເຊັ່ນພາສາອັງກິດ ໄປຫາຕົວອັກສອນພາມເຊັ່ນ Devanagari ສໍາລັບພາສາຮິນດີ.
ຂໍ້ຄວາມພາສາອັງກິດສາມາດຈັດການໄດ້ດ້ວຍຊຸດຕົວອັກສອນທີ່ງ່າຍດາຍເຊັ່ນ ASCII, ແຕ່ພາສາຮິນດີຮຽກຮ້ອງໃຫ້ມີ Unicode (ໂດຍສະເພາະ UTF-8) ເພື່ອເປັນຕົວແທນຂອງຕົວອັກສອນ, ສະຫຼະ, ແລະເຄື່ອງໝາຍສຽງຕ່າງໆ.
ຂະບວນການແປແບບບໍ່ລະມັດລະວັງທີ່ບໍ່ສາມາດຈັດການການເຂົ້າລະຫັດ UTF-8 ໄດ້ຢ່າງຖືກຕ້ອງຕັ້ງແຕ່ຕົ້ນຈົນຈົບ ຈະເຮັດໃຫ້ຂໍ້ຄວາມເສຍຫາຍ, ມີເຄື່ອງໝາຍຄໍາຖາມ, ຫຼືສັນຍາລັກທີ່ບໍ່ມີຄວາມໝາຍອື່ນໆ, ເຮັດໃຫ້ເອກະສານບໍ່ສາມາດອ່ານໄດ້.

ຄວາມສັບສົນຂະຫຍາຍອອກໄປນອກເໜືອຈາກການຈັບຄູ່ຕົວອັກສອນທໍາມະດາ; ຕົວອັກສອນ Devanagari ມີກົດລະບຽບທີ່ສັບຊ້ອນສໍາລັບການສ້າງ ligatures (ຕົວອັກສອນປະສົມ) ແລະ ການລວມຕົວອັກສອນ.
ເຄື່ອງໝາຍສະຫຼະ (matras) ຕິດກັບພະຍັນຊະນະໃນຮູບແບບສະເພາະ, ແລະ ພະຍັນຊະນະປະສົມແມ່ນຖືກສ້າງຕັ້ງຂຶ້ນໂດຍການເຂົ້າຮ່ວມຫຼາຍຕົວອັກສອນເຂົ້າກັນ.
API ບໍ່ພຽງແຕ່ຕ້ອງແປຂໍ້ຄວາມເທົ່ານັ້ນ ແຕ່ຍັງຕ້ອງຮັບປະກັນວ່າເຄື່ອງມືສະແດງຜົນປະກອບສ່ວນປະກອບເຫຼົ່ານີ້ຄືນໃໝ່ຢ່າງຖືກຕ້ອງໃນໄຟລ໌ PDF ສຸດທ້າຍ, ເຊິ່ງເປັນວຽກທີ່ຮຽກຮ້ອງໃຫ້ມີຄວາມສາມາດໃນການສ້າງຮູບແບບຂໍ້ຄວາມທີ່ຊັບຊ້ອນ.

ການຮັກສາຮູບແບບ ແລະ ການຈັດຮູບແບບທີ່ສັບສົນ

ບາງທີຄວາມລົ້ມເຫຼວທີ່ເຫັນໄດ້ຊັດເຈນທີ່ສຸດຂອງລະບົບການແປ PDF ທີ່ບໍ່ໄດ້ມາດຕະຖານແມ່ນການທໍາລາຍຮູບແບບຂອງເອກະສານຕົ້ນສະບັບຢ່າງສົມບູນ.
ໄຟລ໌ PDF ແມ່ນເປັນທີ່ຮູ້ຈັກສໍາລັບຮູບແບບທີ່ອຸດົມສົມບູນແລະຄົງທີ່, ເຊິ່ງສາມາດປະກອບມີຂໍ້ຄວາມຫຼາຍຄໍລໍາມ, ຕາຕະລາງ, ເຄື່ອງໝາຍຫົວ, ເຄື່ອງໝາຍທ້າຍ, ແລະຮູບແບບຕົວອັກສອນສະເພາະ.
ການພຽງແຕ່ສະກັດຂໍ້ຄວາມ, ການແປ, ແລະພະຍາຍາມວາງມັນຄືນໃສ່ໃນເອກະສານ ເກືອບຈະນໍາໄປສູ່ບັນຫາການຈັດຮູບແບບທີ່ຮ້າຍແຮງ ເນື່ອງຈາກຂໍ້ຄວາມທີ່ແປແລ້ວບໍ່ຄ່ອຍມີຄວາມຍາວເທົ່າກັບຂໍ້ຄວາມຕົ້ນສະບັບ.

ຕົວຢ່າງເຊັ່ນ, ຂໍ້ຄວາມພາສາຮິນດີສາມາດສັ້ນກວ່າ ຫຼືຍາວກວ່າຂໍ້ຄວາມພາສາອັງກິດທີ່ທຽບເທົ່າ, ເຊິ່ງເຮັດໃຫ້ການໄຫຼ ແລະ ການຈັດວາງຂອງເອກະສານທີ່ມີຮູບແບບຄົງທີ່ຖືກລົບກວນຢ່າງສິ້ນເຊີງ.
ຕາຕະລາງກາຍເປັນການຈັດວາງຜິດພາດ, ຂໍ້ຄວາມລົ້ນຄໍລໍາທີ່ຖືກກໍານົດໄວ້, ແລະ ການຂຶ້ນໜ້າໃໝ່ເກີດຂຶ້ນໃນບ່ອນທີ່ບໍ່ເໝາະສົມ, ເຮັດໃຫ້ຮູບລັກສະນະທີ່ເປັນມືອາຊີບ ແລະ ຄວາມສາມາດໃນການອ່ານຂອງເອກະສານເສຍຫາຍ.
ດັ່ງນັ້ນ, API ການແປພາສາ PDF ພາສາອັງກິດເປັນຮິນດີ ທີ່ມີປະສິດທິພາບຕ້ອງມີຄວາມສະຫຼາດພຽງພໍທີ່ຈະຈັດການໄຫຼຂອງຂໍ້ຄວາມຄືນໃໝ່ພາຍໃນຂອບເຂດຕົ້ນສະບັບ, ປັບຂະໜາດຕົວອັກສອນໃນບ່ອນທີ່ຈໍາເປັນ, ແລະ ສ້າງຕາຕະລາງ ແລະ ຄໍລໍາຄືນໃໝ່ຢ່າງລະມັດລະວັງ.

ການຈັດການຮູບພາບທີ່ຝັງໄວ້ ແລະ Vector Graphics

ເອກະສານ PDF ແມ່ນພາຊະນະບັນຈຸສື່ຫຼາກຫຼາຍຊະນິດ, ເຊິ່ງມັກຈະປະກອບມີຮູບພາບ raster (ເຊັ່ນ JPEGs) ແລະ vector graphics (ເຊັ່ນ: ຕາຕະລາງ ແລະ ແຜນວາດ).
ສິ່ງທ້າທາຍທີ່ສໍາຄັນແມ່ນການດໍາເນີນການແປຂໍ້ຄວາມໂດຍບໍ່ມີການທໍາລາຍຫຼືຍ້າຍອົງປະກອບທີ່ບໍ່ແມ່ນຂໍ້ຄວາມເຫຼົ່ານີ້.
ສະຄຣິບ ຫຼື ເຄື່ອງມືທໍາມະດາຈໍານວນຫຼາຍທີ່ພະຍາຍາມວິເຄາະ PDF ອາດຈະຖອດອົງປະກອບກາຟິກອອກ ຫຼືປ່ຽນແປງຕໍາແໜ່ງຂອງມັນໂດຍບໍ່ໄດ້ຕັ້ງໃຈ, ເຮັດໃຫ້ເອກະສານສຸດທ້າຍຖືກແຕກຫັກທາງດ້ານສາຍຕາ.

ນອກຈາກນັ້ນ, ບາງຂໍ້ຄວາມອາດຈະຖືກຝັງຢູ່ໃນຮູບພາບເອງ, ເຊິ່ງຮຽກຮ້ອງໃຫ້ມີເທັກໂນໂລຍີ Optical Character Recognition (OCR) ເພື່ອສະກັດ, ແປ, ແລະ ທີ່ດີທີ່ສຸດແມ່ນການສະແດງຂໍ້ຄວາມທີ່ແປແລ້ວຄືນໃສ່ໃນຮູບພາບ.
API ລະດັບມືອາຊີບຈໍາເປັນຕ້ອງມີຄວາມສາມາດໃນການກໍານົດແລະແຍກຂໍ້ຄວາມທີ່ສາມາດແປໄດ້ ໃນຂະນະທີ່ຮັກສາອົງປະກອບກາຟິກທັງໝົດໄວ້ໃນຕໍາແໜ່ງແລະຄຸນນະພາບຕົ້ນສະບັບຂອງມັນຢ່າງລະມັດລະວັງ.
ອັນນີ້ຮັບປະກັນວ່າສະພາບການທາງດ້ານສາຍຕາທີ່ສໍາຄັນ, ເຊັ່ນ: ຕາຕະລາງ, ແຜນວາດ, ແລະໂລໂກ້, ຍັງຄົງຢູ່ໃນສະພາບສົມບູນຫຼັງຈາກການແປ.

ການແນະນໍາ Doctranslate API ສໍາລັບການແປພາສາ PDF ພາສາອັງກິດເປັນຮິນດີ

ເມື່ອປະເຊີນໜ້າກັບສິ່ງທ້າທາຍທີ່ສັບສົນເຫຼົ່ານີ້, ການສ້າງລະບົບການແປ PDF ທີ່ເຊື່ອຖືໄດ້ຕັ້ງແຕ່ເລີ່ມຕົ້ນແມ່ນຄວາມພະຍາຍາມທີ່ບໍ່ມີປະສິດທິພາບ ແລະມີຄວາມສ່ຽງຕໍ່ຄວາມຜິດພາດສູງສໍາລັບທີມພັດທະນາສ່ວນໃຫຍ່.
ນີ້ແມ່ນບ່ອນທີ່ Doctranslate API ສະໜອງວິທີແກ້ໄຂທີ່ແນ່ນອນ, ໂດຍສະເໜີບໍລິການທີ່ຊ່ຽວຊານ ແລະເຂັ້ມແຂງ ທີ່ຖືກອອກແບບສະເພາະສໍາລັບການແປເອກະສານທີ່ມີຄວາມຖືກຕ້ອງສູງ.
ໂດຍການນໍາໃຊ້ເຄື່ອງຈັກທີ່ຊັບຊ້ອນ, ມັນຈັດການກັບຄວາມແຕກຕ່າງເລັກນ້ອຍຂອງໂຄງສ້າງ PDF, ການເຂົ້າລະຫັດ, ແລະຮູບແບບ, ຊ່ວຍໃຫ້ນັກພັດທະນາສຸມໃສ່ເຫດຜົນຫຼັກຂອງແອັບພລິເຄຊັນຂອງພວກເຂົາ.

Doctranslate API ແມ່ນບໍລິການ RESTful, ຊຶ່ງໝາຍຄວາມວ່າມັນໃຊ້ວິທີການ HTTP ມາດຕະຖານ ແລະ ງ່າຍຕໍ່ການເຊື່ອມໂຍງເຂົ້າກັບ stack ແອັບພລິເຄຊັນທີ່ທັນສະໄໝໃດກໍ່ຕາມ, ບໍ່ວ່າຈະສ້າງຂຶ້ນດ້ວຍ Python, Node.js, Java, ຫຼືພາສາອື່ນໆ.
ມັນໄດ້ສະກັດກັ້ນຄວາມສັບສົນອັນໃຫຍ່ຫຼວງຂອງການວິເຄາະ PDF, ການສ້າງຮູບແບບຂໍ້ຄວາມສໍາລັບຕົວອັກສອນ Devanagari, ແລະ ການສ້າງຮູບແບບຄືນໃໝ່.
ນັກພັດທະນາພຽງແຕ່ສາມາດສົ່ງໄຟລ໌ PDF ຕົ້ນສະບັບ ແລະໄດ້ຮັບເອກະສານທີ່ແປແລ້ວຢ່າງສົມບູນແບບ ເຊິ່ງສະທ້ອນເຖິງການຈັດຮູບແບບຕົ້ນສະບັບ, ທັງໝົດນີ້ແມ່ນຜ່ານການໂທຫາ API ງ່າຍໆສອງສາມຄັ້ງ.

ຄຸນສົມບັດຫຼັກຂອງ Doctranslate REST API

Doctranslate API ຖືກສ້າງຂຶ້ນໂດຍຄໍານຶງເຖິງນັກພັດທະນາ, ໂດຍເນັ້ນໃສ່ຄວາມງ່າຍດາຍ, ພະລັງງານ, ແລະຄວາມສາມາດໃນການຂະຫຍາຍໄດ້.
ໜຶ່ງໃນຄຸນສົມບັດຫຼັກຂອງມັນແມ່ນ ຮູບແບບການປະມວນຜົນແບບ asynchronous, ເຊິ່ງເໝາະສຳລັບການຈັດການໄຟລ໌ PDF ຂະໜາດໃຫຍ່ ແລະຊັບຊ້ອນ ໂດຍບໍ່ໄດ້ຜູກມັດຊັບພະຍາກອນຂອງແອັບພລິເຄຊັນຂອງທ່ານ.
ທ່ານສົ່ງວຽກການແປພາສາ ແລະສາມາດສອບຖາມສະຖານະຂອງມັນ ຫຼື ໃຊ້ webhooks ເພື່ອຮັບການແຈ້ງເຕືອນເມື່ອສໍາເລັດ, ເຊິ່ງເປັນວິທີການທີ່ເຂັ້ມແຂງກວ່າການຮ້ອງຂໍແບບ synchronous, blocking.

ນອກເໜືອໄປຈາກເຄື່ອງຈັກການແປທີ່ມີປະສິດທິພາບ, API ຍັງສະໜອງ ການຮອງຮັບຮູບແບບທີ່ບໍ່ມີໃຜທຽບເທົ່າ, ຈັດການບໍ່ພຽງແຕ່ PDFs ເທົ່ານັ້ນ ແຕ່ຍັງມີ DOCX, PPTX, XLSX, ແລະອື່ນໆ.
ຄວາມຍືດຫຍຸ່ນນີ້ຊ່ວຍໃຫ້ທ່ານສ້າງຄຸນສົມບັດການແປທີ່ຄົບຖ້ວນເຊິ່ງຕອບສະໜອງຄວາມຕ້ອງການຂອງຜູ້ໃຊ້ທີ່ຫຼາກຫຼາຍ.
API ຍັງສະໜອງການຕອບສະໜອງ JSON ທີ່ງ່າຍດາຍ ແລະຄາດເດົາໄດ້, ເຮັດໃຫ້ງ່າຍຕໍ່ການວິເຄາະຜົນໄດ້ຮັບ ແລະຈັດການວຽກການແປພາສາດ້ວຍໂປຣແກຣມ.

ຄູ່ມືຂັ້ນຕອນຕໍ່ຂັ້ນຕອນໃນການເຊື່ອມໂຍງ API

ການເຊື່ອມໂຍງ API ການແປພາສາ PDF ພາສາອັງກິດເປັນຮິນດີເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານແມ່ນຂະບວນການທີ່ງ່າຍດາຍ.
ຄູ່ມືນີ້ຈະນໍາພາທ່ານຜ່ານຂັ້ນຕອນທີ່ຈໍາເປັນ, ຕັ້ງແຕ່ການໄດ້ຮັບລະຫັດ API ຂອງທ່ານໄປຈົນເຖິງການສົ່ງຄໍາຮ້ອງຂໍການແປຄັ້ງທໍາອິດຂອງທ່ານແລະການໄດ້ຮັບຜົນ.
ພວກເຮົາຈະສະໜອງຕົວຢ່າງລະຫັດທີ່ສົມບູນໃນ Python, ເຊິ່ງເປັນໜຶ່ງໃນພາສາທີ່ນິຍົມທີ່ສຸດສໍາລັບການພັດທະນາ backend ແລະ scripting.

ເງື່ອນໄຂເບື້ອງຕົ້ນ: ການໄດ້ຮັບລະຫັດ API ຂອງທ່ານ

ກ່ອນທີ່ທ່ານຈະສາມາດໂທຫາ API ໃດໆໄດ້, ທ່ານຈໍາເປັນຕ້ອງໄດ້ຮັບລະຫັດ API, ເຊິ່ງເຮັດໜ້າທີ່ກວດສອບຄວາມຖືກຕ້ອງຂອງຄໍາຮ້ອງຂໍຂອງທ່ານ.
ທ່ານສາມາດເອົາລະຫັດຂອງທ່ານໄດ້ໂດຍການລົງທະບຽນຢູ່ໃນພອດທໍນັກພັດທະນາ Doctranslate.
ເມື່ອທ່ານມີລະຫັດຂອງທ່ານແລ້ວ, ໃຫ້ແນ່ໃຈວ່າຈະເກັບຮັກສາມັນໄວ້ຢ່າງປອດໄພ, ຕົວຢ່າງເຊັ່ນ, ເປັນຕົວແປສະພາບແວດລ້ອມ, ແລະຢ່າເປີດເຜີຍມັນຢູ່ໃນລະຫັດຝ່າຍລູກຄ້າເດັດຂາດ.

ຂັ້ນຕອນທີ 1: ການຕັ້ງຄ່າສະພາບແວດລ້ອມ Python ຂອງທ່ານ

ສໍາລັບຕົວຢ່າງ Python ຂອງພວກເຮົາ, ພວກເຮົາຈະໃຊ້ library requests ທີ່ນິຍົມເພື່ອຈັດການຄໍາຮ້ອງຂໍ HTTP.
ຖ້າທ່ານບໍ່ໄດ້ຕິດຕັ້ງມັນ, ທ່ານສາມາດເພີ່ມມັນເຂົ້າໃນສະພາບແວດລ້ອມຂອງທ່ານໄດ້ຢ່າງງ່າຍດາຍໂດຍໃຊ້ pip.
ເປີດ terminal ຂອງທ່ານ ແລະ ດໍາເນີນການຄໍາສັ່ງ pip install requests ເພື່ອຕິດຕັ້ງ library ແລະ ການເພິ່ງພາອາໄສຂອງມັນ.

ຂັ້ນຕອນທີ 2: ການກະກຽມຄໍາຮ້ອງຂໍ API ສໍາລັບການແປ PDF

ເພື່ອແປເອກະສານ, ທ່ານຈະສົ່ງຄໍາຮ້ອງຂໍ POST ໄປຫາຈຸດສິ້ນສຸດ /v3/documents/translate.
ຄໍາຮ້ອງຂໍນີ້ຕ້ອງໄດ້ຮັບການຈັດຮູບແບບເປັນ multipart/form-data ແລະປະກອບມີໄຟລ໌ເອກະສານນັ້ນເອງ ພ້ອມກັບພາລາມິເຕີທີ່ຕ້ອງການຈໍານວນໜຶ່ງ.
ພາລາມິເຕີເຫຼົ່ານີ້ກໍານົດພາສາຕົ້ນສະບັບ (source_lang), ພາສາເປົ້າໝາຍ (target_lang), ແລະການຕັ້ງຄ່າທາງເລືອກອື່ນໆເພື່ອປັບແຕ່ງການແປ.

ຂັ້ນຕອນທີ 3: ການສົ່ງ PDF ເພື່ອການແປ (ລະຫັດ Python)

ສະຄຣິບ Python ຕໍ່ໄປນີ້ສະແດງໃຫ້ເຫັນວິທີການສ້າງແລະສົ່ງຄໍາຮ້ອງຂໍການແປ.
ມັນເປີດໄຟລ໌ PDF ໃນໂໝດຖານສອງ, ຕັ້ງພາລາມິເຕີພາສາທີ່ຕ້ອງການ, ແລະປະກອບມີລະຫັດ API ຂອງທ່ານໃນ headers ສໍາລັບການກວດສອບຄວາມຖືກຕ້ອງ.
ລະຫັດນີ້ສົ່ງໄຟລ໌ໄປຫາ Doctranslate API ແລະພິມການຕອບສະໜອງເບື້ອງຕົ້ນຈາກເຊີບເວີ.


import requests
import os

# Your API key from the Doctranslate developer portal
API_KEY = os.environ.get("DOCTRANSLATE_API_KEY", "YOUR_API_KEY_HERE")
API_URL = "https://developer.doctranslate.io/v3/documents/translate"

# Path to the source PDF file you want to translate
file_path = "path/to/your/document.pdf"

# API parameters
params = {
    'source_lang': 'en',  # English
    'target_lang': 'hi',  # Hindi
    'is_bilingual': 'false'
}

headers = {
    'Authorization': f'Bearer {API_KEY}'
}

try:
    with open(file_path, 'rb') as f:
        files = {
            'document': (os.path.basename(file_path), f, 'application/pdf')
        }

        # Send the POST request to the API
        response = requests.post(API_URL, headers=headers, data=params, files=files)

        # Raise an exception for bad status codes (4xx or 5xx)
        response.raise_for_status()

        # Print the JSON response
        print("Translation job submitted successfully:")
        print(response.json())

except FileNotFoundError:
    print(f"Error: The file was not found at {file_path}")
except requests.exceptions.RequestException as e:
    print(f"An error occurred: {e}")

ຂັ້ນຕອນທີ 4: ການຈັດການການຕອບສະໜອງ API ແລະ ການດາວໂຫຼດ

ຫຼັງຈາກສົ່ງເອກະສານສໍາເລັດແລ້ວ, API ຈະສົ່ງຄືນວັດຖຸ JSON ທີ່ມີ document_id.
ເນື່ອງຈາກການແປແມ່ນ asynchronous, ທ່ານຈະໃຊ້ ID ນີ້ເພື່ອກວດເບິ່ງສະຖານະຂອງວຽກ ໂດຍການສ້າງຄໍາຮ້ອງຂໍ GET ໄປຫາ /v3/documents/{document_id}.
ເມື່ອສະຖານະເປັນ ‘done’, ການຕອບສະໜອງຈະປະກອບມີ url ທີ່ທ່ານສາມາດດາວໂຫລດໄຟລ໌ PDF ພາສາຮິນດີທີ່ແປແລ້ວໄດ້.

ຕົວຢ່າງ Node.js ສໍາລັບການປຽບທຽບ

ເພື່ອສະແດງໃຫ້ເຫັນເຖິງຄວາມຍືດຫຍຸ່ນຂອງ API, ນີ້ແມ່ນຕົວຢ່າງທີ່ທຽບເທົ່າໃນ Node.js ໂດຍໃຊ້ library axios ແລະ form-data.
ສະຄຣິບນີ້ເຮັດໜ້າທີ່ດຽວກັນ: ມັນອ່ານໄຟລ໌ PDF ໃນເຄື່ອງ ແລະສົ່ງມັນໄປຫາ Doctranslate API ເພື່ອແປຈາກພາສາອັງກິດເປັນຮິນດີ.
ອັນນີ້ສະແດງໃຫ້ເຫັນວ່າ REST API ສາມາດຖືກລວມເຂົ້າກັບບໍລິການ backend ທີ່ອີງໃສ່ JavaScript ໄດ້ງ່າຍພຽງໃດ.


const axios = require('axios');
const fs = require('fs');
const FormData = require('form-data');

// Your API key and API endpoint
const API_KEY = process.env.DOCTRANSLATE_API_KEY || 'YOUR_API_KEY_HERE';
const API_URL = 'https://developer.doctranslate.io/v3/documents/translate';

// Path to your source PDF file
const filePath = 'path/to/your/document.pdf';

async function translateDocument() {
  const form = new FormData();
  form.append('document', fs.createReadStream(filePath));
  form.append('source_lang', 'en');
  form.append('target_lang', 'hi');

  try {
    const response = await axios.post(API_URL, form, {
      headers: {
        ...form.getHeaders(),
        'Authorization': `Bearer ${API_KEY}`,
      },
    });

    console.log('Translation job submitted successfully:');
    console.log(response.data);
  } catch (error) {
    console.error('An error occurred:', error.response ? error.response.data : error.message);
  }
}

translateDocument();

ຂໍ້ພິຈາລະນາທີ່ສໍາຄັນສໍາລັບການແປພາສາຮິນດີ

ການແປເນື້ອຫາເປັນພາສາຮິນດີກ່ຽວຂ້ອງກັບຫຼາຍກວ່າຄວາມຖືກຕ້ອງທາງດ້ານພາສາສາດ; ມັນຮຽກຮ້ອງໃຫ້ມີຄວາມແມ່ນຍໍາທາງດ້ານເຕັກນິກໃນການຈັດການຕົວອັກສອນ Devanagari.
Doctranslate API ຖືກອອກແບບມາສະເພາະເພື່ອຈັດການກັບຄວາມສັບສົນເຫຼົ່ານີ້, ຮັບປະກັນວ່າເອກະສານສຸດທ້າຍບໍ່ພຽງແຕ່ຖືກຕ້ອງທາງດ້ານພາສາສາດເທົ່ານັ້ນ ແຕ່ຍັງຖືກສະແດງຜົນໄດ້ຢ່າງສົມບູນ.
ຄວາມເຂົ້າໃຈຂໍ້ພິຈາລະນາເຫຼົ່ານີ້ຊ່ວຍໃຫ້ທ່ານເຫັນຄຸນຄ່າຂອງພະລັງງານຂອງວິທີແກ້ໄຂການແປເອກະສານພິເສດ.

ຕົວອັກສອນ Devanagari ແລະ Unicode

ຕົວອັກສອນ Devanagari ທີ່ໃຊ້ສໍາລັບພາສາຮິນດີແມ່ນສັບສົນຫຼາຍໃນການສະແດງຜົນກວ່າຕົວອັກສອນລາຕິນ.
ມັນແມ່ນ abugida, ບ່ອນທີ່ພະຍັນຊະນະມີສະຫຼະໃນຕົວເຊິ່ງສາມາດປ່ຽນແປງໄດ້ດ້ວຍເຄື່ອງໝາຍສະຫຼະຕ່າງໆ (matras).
Doctranslate API ຮັບປະກັນວ່າຂໍ້ຄວາມທັງໝົດຖືກປະມວນຜົນດ້ວຍ ການປະຕິບັດຕາມ Unicode (UTF-8) ຢ່າງເຕັມສ່ວນ, ປ້ອງກັນຄວາມເສຍຫາຍຂອງຕົວອັກສອນ ແລະ ຮັບປະກັນວ່າທຸກ matra ແລະ ພະຍັນຊະນະປະສົມຖືກເປັນຕົວແທນຢ່າງຖືກຕ້ອງ.

ການສະແດງຜົນຕົວອັກສອນ ແລະ Glyphs

ຈຸດລົ້ມເຫຼວທົ່ວໄປໃນການສ້າງ PDF ແມ່ນການຮອງຮັບຕົວອັກສອນ. ຖ້າຕົວອັກສອນທີ່ໃຊ້ໃນເອກະສານສຸດທ້າຍບໍ່ມີ glyphs ທີ່ຈໍາເປັນສໍາລັບ Devanagari, ຂໍ້ຄວາມຈະປາກົດເປັນກ່ອງເປົ່າ, ເຊິ່ງມັກຈະຖືກເອີ້ນວ່າ ‘tofu’.
ລະບົບຂອງພວກເຮົາຈັດການການປ່ຽນແທນ ແລະ ການຝັງຕົວອັກສອນຢ່າງສະຫຼາດ, ຮັບປະກັນວ່າຕົວອັກສອນທີ່ເຂົ້າກັນໄດ້ຖືກນໍາໃຊ້ເພື່ອສະແດງຂໍ້ຄວາມພາສາຮິນດີຢ່າງຖືກຕ້ອງ.
ອັນນີ້ຮັບປະກັນວ່າ PDF ທີ່ແປແລ້ວຈະສາມາດອ່ານໄດ້ໃນທຸກອຸປະກອນ, ໂດຍບໍ່ຄໍານຶງເຖິງຕົວອັກສອນທີ່ຕິດຕັ້ງຂອງຜູ້ໃຊ້.

ການຈັດການຄວາມແຕກຕ່າງເລັກນ້ອຍທາງດ້ານວັດທະນະທໍາ ແລະ ພາສາສາດ

ນອກເໜືອໄປຈາກດ້ານເຕັກນິກ, ການແປພາສາທີ່ມີຄຸນນະພາບສູງຮຽກຮ້ອງໃຫ້ມີເຄື່ອງຈັກທີ່ຊັບຊ້ອນທີ່ເຂົ້າໃຈສະພາບການ, ວະລີສໍານວນ, ແລະຄວາມແຕກຕ່າງທາງດ້ານວັດທະນະທໍາ.
ຮູບແບບການແປດ້ວຍເຄື່ອງຈັກທີ່ Doctranslate API ນໍາໃຊ້ແມ່ນໄດ້ຮັບການຝຶກອົບຮົມໃນຊຸດຂໍ້ມູນຂະໜາດໃຫຍ່, ເຮັດໃຫ້ພວກມັນສາມາດສ້າງການແປທີ່ບໍ່ພຽງແຕ່ເປັນຕົວໜັງສືເທົ່ານັ້ນ ແຕ່ຍັງຟັງໄດ້ຢ່າງເປັນທໍາມະຊາດ ແລະ ເໝາະສົມກັບສະພາບການ.
ລະດັບຄຸນນະພາບນີ້ເປັນສິ່ງສໍາຄັນສໍາລັບເອກະສານທີ່ເປັນມືອາຊີບທີ່ຄວາມຊັດເຈນແລະຄວາມຖືກຕ້ອງເປັນສິ່ງສໍາຄັນທີ່ສຸດ.

ຂໍ້ຄິດເຫັນສຸດທ້າຍ ແລະ ຂັ້ນຕອນຕໍ່ໄປ

ການເຮັດໃຫ້ການແປ PDF ຈາກພາສາອັງກິດເປັນຮິນດີເປັນແບບອັດຕະໂນມັດແມ່ນເປັນວຽກທີ່ສັບສົນທີ່ເຕັມໄປດ້ວຍຂໍ້ບົກພ່ອງທາງດ້ານເຕັກນິກ, ຕັ້ງແຕ່ການຮັກສາຮູບແບບທີ່ລະອຽດອ່ອນໄປຈົນເຖິງການສະແດງຕົວອັກສອນ Devanagari ຢ່າງຖືກຕ້ອງ.
Doctranslate API ສະໜອງວິທີແກ້ໄຂທີ່ມີປະສິດທິພາບແລະຄ່ອງຕົວ, ໂດຍສະກັດກັ້ນຄວາມສັບສົນນີ້ໄວ້ທາງຫລັງຂອງການໂຕ້ຕອບ RESTful ທີ່ງ່າຍດາຍ.
ໂດຍການເຊື່ອມໂຍງ API ຂອງພວກເຮົາ, ທ່ານສາມາດສະໜອງເອກະສານທີ່ແປໄດ້ຢ່າງຖືກຕ້ອງ ແລະ ມີຄວາມໜ້າເຊື່ອຖືສູງໃຫ້ກັບຜູ້ໃຊ້ຂອງທ່ານ ດ້ວຍຄວາມພະຍາຍາມໃນການພັດທະນາໜ້ອຍທີ່ສຸດ.

ເທັກໂນໂລຍີທີ່ມີປະສິດທິພາບນີ້ຊ່ວຍໃຫ້ທ່ານສາມາດທໍາລາຍອຸປະສັກດ້ານພາສາ ແລະເຂົ້າເຖິງກຸ່ມເປົ້າໝາຍທີ່ກວ້າງຂວາງໄດ້ຢ່າງມີປະສິດທິພາບ.
ເພື່ອເບິ່ງພະລັງງານດ້ວຍຕົວທ່ານເອງ, ທ່ານສາມາດ ແປ PDF ພາສາອັງກິດຂອງທ່ານເປັນຮິນດີໄດ້ຢ່າງງ່າຍດາຍ ໃນຂະນະທີ່ຮັກສາຮູບແບບ ແລະ ຕາຕະລາງຕົ້ນສະບັບໄວ້ຢ່າງສົມບູນ ດ້ວຍເຄື່ອງມືອອນລາຍຂອງພວກເຮົາ.
ສໍາລັບການເຈາະເລິກເຂົ້າໄປໃນພາລາມິເຕີທີ່ມີຢູ່ທັງຫມົດ, ຄຸນສົມບັດຂັ້ນສູງ, ແລະຮູບແບບອື່ນໆທີ່ຮອງຮັບ, ພວກເຮົາຂໍແນະນໍາໃຫ້ທ່ານຄົ້ນຫາເອກະສານ Doctranslate Developer Documentation ຢ່າງເປັນທາງການສໍາລັບຄໍາແນະນໍາທີ່ຄົບຖ້ວນ.

Doctranslate.io - ການແປທີ່ວ່ອງໄວ, ຖືກຕ້ອງ ໃນຫຼາຍພາສາ

Để lại bình luận

chat