Doctranslate.io

PDF Translation API: ອັງກິດ ເຖິງ ດັດຊ໌ | ຮັກສາຮູບແບບໄດ້ໄວ

Diterbitkan oleh

pada

ຜູ້ພັດທະນາຫຼາຍຄັ້ງປະເຊີນກັບສິ່ງທ້າທາຍທີ່ສໍາຄັນເມື່ອໄດ້ຮັບມອບໝາຍການແປເອກະສານແບບໂປຣແກຣມມິຕ.
ຄວາມຕ້ອງການສໍາລັບໂຊລູຊັ່ນ PDF Translation API ອັງກິດ ເຖິງ ດັດຊ໌ ທີ່ເຂັ້ມແຂງແມ່ນນັບມື້ນັບເພີ່ມຂຶ້ນ, ໂດຍສະເພາະສຳລັບທຸລະກິດທີ່ກຳລັງຂະຫຍາຍໄປສູ່ ເນເທີແລນ ແລະ ແບນຊິກ.
ຄູ່ມືນີ້ຈະສະໜອງການຍ່າງຜ່ານທີ່ສົມບູນແບບຂອງອຸປະສັກທາງດ້ານເຕັກນິກທີ່ກ່ຽວຂ້ອງ ແລະ ນຳສະເໜີໂຊລູຊັ່ນທີ່ມີປະສິດທິພາບ ແລະ ເປັນມິດກັບຜູ້ພັດທະນາ ເພື່ອບັນລຸການເຊື່ອມໂຍງທີ່ບໍ່ມີຮອຍຕໍ່.

ເປັນຫຍັງການແປ PDF ຜ່ານ API ຈຶ່ງຍາກໂດຍທຳມະຊາດ

ຮູບແບບເອກະສານແບບພົກພາ (PDF) ໄດ້ຖືກອອກແບບມາສໍາລັບການນໍາສະເໜີເນື້ອໃນ, ບໍ່ແມ່ນສໍາລັບການສະກັດເອົາຂໍ້ມູນ ຫຼື ການຈັດການຂໍ້ມູນໄດ້ງ່າຍ.
ຫຼັກການພື້ນຖານນີ້ສ້າງອຸປະສັກຈຳນວນຫຼາຍສຳລັບລະບົບການແປແບບອັດຕະໂນມັດ, ຮຽກຮ້ອງໃຫ້ມີວິສະວະກຳທີ່ຊັບຊ້ອນເພື່ອເອົາຊະນະສິ່ງທ້າທາຍເຫຼົ່ານັ້ນຢ່າງມີປະສິດທິພາບ.
ການເຂົ້າໃຈສິ່ງທ້າທາຍຫຼັກເຫຼົ່ານີ້ເນັ້ນໃຫ້ເຫັນວ່າເປັນຫຍັງ API ສະເພາະຈຶ່ງບໍ່ແມ່ນພຽງແຕ່ຄວາມສະດວກສະບາຍເທົ່ານັ້ນ ແຕ່ເປັນສິ່ງຈຳເປັນສຳລັບຜົນໄດ້ຮັບທີ່ເຊື່ອຖືໄດ້.

ສິ່ງທ້າທາຍຂອງການເຂົ້າລະຫັດແບບ Binary ແລະ ໂຄງສ້າງ

ບໍ່ເໝືອນກັບຂໍ້ຄວາມທໍາມະດາ ຫຼື HTML, PDF ແມ່ນໄຟລ໌ binary ທີ່ຊັບຊ້ອນ, ຄ້າຍຄືກັບໂປຣແກຣມທີ່ຖືກລວບລວມສໍາລັບເຄື່ອງພິມສະເໝືອນ.
ເນື້ອໃນຂອງມັນບໍ່ໄດ້ຖືກເກັບໄວ້ໃນກະແສທີ່ສາມາດອ່ານໄດ້ເປັນເສັ້ນຊື່ ແຕ່ປະກອບດ້ວຍວັດຖຸ, ກະແສ, ແລະ ຕາຕະລາງການອ້າງອິງຂ້າມທີ່ກໍານົດຮູບແບບຂອງເອກະສານ.
ການວິເຄາະໂຄງສ້າງນີ້ເພື່ອສະກັດຂໍ້ຄວາມສໍາລັບການແປໄດ້ຢ່າງຖືກຕ້ອງ, ໃນຂະນະທີ່ບໍ່ສົນໃຈຂໍ້ມູນທີ່ບໍ່ແມ່ນຂໍ້ຄວາມ, ແມ່ນອຸປະສັກສໍາຄັນທໍາອິດທີ່ລະບົບອັດຕະໂນມັດຕ້ອງໄດ້ຜ່ານໄປ.

ການສະກັດຂໍ້ຄວາມອອກຈາກຮູບແບບ binary ນີ້ຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈຢ່າງເລິກເຊິ່ງກ່ຽວກັບສະເພາະຂອງ PDF, ເຊິ່ງມີຄວາມຍາວຫຼາຍຮ້ອຍໜ້າ.
ເຄື່ອງຂູດຂໍ້ຄວາມງ່າຍໆຈະລົ້ມເຫຼວ, ເນື່ອງຈາກພວກມັນບໍ່ສາມາດຕີຄວາມຄຳສັ່ງຂອງການສະແດງຜົນທີ່ວາງຕົວອັກສອນ ແລະ ຄໍາສັບຕ່າງໆໃສ່ໃນໜ້າໄດ້.
API ທີ່ມີປະສິດທິພາບຕ້ອງມີເຄື່ອງຈັກວິເຄາະທີ່ມີພະລັງທີ່ສາມາດສ້າງກະແສຂໍ້ຄວາມທີ່ມີເຫດຜົນຄືນໃໝ່ຈາກຄໍາສັ່ງທີ່ຊັບຊ້ອນເຫຼົ່ານີ້ກ່ອນທີ່ການແປຈະສາມາດເລີ່ມຕົ້ນໄດ້.

ການຮັກສາຮູບແບບ, ຕາຕະລາງ, ແລະ ຮູບພາບທີ່ຊັບຊ້ອນ

ຂໍ້​ໄດ້​ປຽບ​ຕົ້ນຕໍ​ຂອງ​ຮູບ​ແບບ PDF ແມ່ນ​ຄວາມ​ສາ​ມາດ​ໃນ​ການ​ຮັກ​ສາ​ຮູບ​ແບບ​ຄົງ​ທີ່​ໃນ​ທົ່ວ​ທຸກ​ອຸ​ປະ​ກອນ​ແລະ​ລະ​ບົບ​ປະ​ຕິ​ບັດ​ການ.
ຄຸນສົມບັດນີ້ກາຍເປັນສິ່ງທ້າທາຍທີ່ສໍາຄັນໃນລະຫວ່າງການແປ, ເນື່ອງຈາກຂໍ້ຄວາມທີ່ແປແລ້ວບໍ່ຄ່ອຍມີຄວາມຍາວເທົ່າກັບຂໍ້ຄວາມຕົ້ນສະບັບ.
ຕົວຢ່າງ, ຄໍາສັບພາສາດັດຊ໌ອາດຈະຍາວຂຶ້ນຢ່າງຫຼວງຫຼາຍເມື່ອທຽບກັບຄໍາສັບພາສາອັງກິດ, ເຊິ່ງສາມາດເຮັດໃຫ້ຂໍ້ຄວາມລົ້ນຂອບເຂດທີ່ຖືກກໍານົດໄວ້, ເຮັດໃຫ້ຕາຕະລາງ, ແຜນວາດ, ແລະການຈັດລຽງທາງດ້ານສາຍຕາເສຍຫາຍ.

ວິທີການແປແບບງ່າຍດາຍທີ່ພຽງແຕ່ປ່ຽນຂໍ້ຄວາມສະຕຣິງຈະທໍາລາຍລັກສະນະເປັນມືອາຊີບຂອງເອກະສານຢ່າງຫຼີກລ້ຽງບໍ່ໄດ້.
PDF translation API ທີ່ຊັບຊ້ອນຕ້ອງເຮັດຫຼາຍກວ່າການແປ; ມັນຕ້ອງປະຕິບັດຂະບວນການຈັດຮູບແບບຄືນໃໝ່ທີ່ຊັບຊ້ອນ.
ນີ້ກ່ຽວຂ້ອງກັບການຄິດໄລ່ຄືນໃໝ່ຂອງພິກັດ, ການປັບຂະໜາດຕົວອັກສອນ, ແລະ ການປັບຂະໜາດບລັອກເນື້ອຫາແບບເຄື່ອນໄຫວເພື່ອຮອງຮັບຂໍ້ຄວາມໃໝ່ ໃນຂະນະທີ່ຮັກສາຄວາມຄົງຕົວທາງສາຍຕາຕົ້ນສະບັບຂອງເອກະສານ.

ການຈັດການຕົວອັກສອນ, ຊຸດຕົວອັກສອນ, ແລະ ຮູບພາບ

ເອກະສານ PDF ສາມາດຝັງຕົວອັກສອນແບບກຳນົດເອງ, ເຊິ່ງອາດຈະບໍ່ຮອງຮັບຕົວອັກສອນທີ່ຕ້ອງການສຳລັບພາສາເປົ້າໝາຍ.
ຖ້າເອກະສານພາສາອັງກິດໃຊ້ຕົວອັກສອນທີ່ຂາດຕົວອັກສອນດັດຊ໌ທີ່ມີເຄື່ອງໝາຍ diacritics (ເຊັ່ນ ë ຫຼື ï), API ຕ້ອງທົດແທນມັນຢ່າງສະຫຼາດດ້ວຍທາງເລືອກທີ່ເໝາະສົມ.
ຂະບວນການທົດແທນຕົວອັກສອນນີ້ຈໍາເປັນຕ້ອງບໍ່ມີຮອຍຕໍ່ເພື່ອຫຼີກເວັ້ນການປ່ຽນແປງທາງສາຍຕາທີ່ກະທົບກະເທືອນ ຫຼື ຂໍ້ຜິດພາດໃນການສະແດງຜົນທີ່ຮູ້ຈັກກັນໃນນາມ ‘tofu’ (ກ່ອງເປົ່າ) ບ່ອນທີ່ຕົວອັກສອນຄວນຢູ່.

ນອກຈາກນັ້ນ, ຂໍ້ຄວາມສາມາດຖືກຝັງຢູ່ພາຍໃນຮູບພາບ ຫຼື ກຣາຟິກ vector, ເຮັດໃຫ້ມັນເບິ່ງບໍ່ເຫັນຕໍ່ວິທີການສະກັດຂໍ້ຄວາມມາດຕະຖານ.
API ຂັ້ນສູງຈໍາເປັນຕ້ອງລວມເອົາເຕັກໂນໂລຢີ Optical Character Recognition (OCR) ເພື່ອກໍານົດແລະສະກັດຂໍ້ຄວາມທີ່ຖືກ rasterized ນີ້.
ຫຼັງຈາກການສະກັດແລະການແປ, API ຈະຕ້ອງສ້າງຮູບພາບຄືນໃໝ່ດ້ວຍຂໍ້ຄວາມທີ່ແປແລ້ວ, ໂດຍການຈັບຄູ່ພື້ນຫຼັງຕົ້ນສະບັບ, ຮູບແບບຕົວອັກສອນ, ແລະ ຕຳແໜ່ງຢ່າງລະມັດລະວັງ.

ຂໍແນະນຳ Doctranslate PDF Translation API

Doctranslate API ໄດ້ຖືກອອກແບບສະເພາະເພື່ອເອົາຊະນະສິ່ງທ້າທາຍທີ່ຊັບຊ້ອນຂອງການແປເອກະສານ PDF.
ມັນສະຫນອງໂຊລູຊັ່ນທີ່ເຂັ້ມແຂງ, ສາມາດຂະຫຍາຍໄດ້, ແລະ ເປັນມິດກັບຜູ້ພັດທະນາສໍາລັບການແປເອກະສານຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌ ດ້ວຍຄວາມຖືກຕ້ອງພິເສດ ແລະ ຄວາມສັດຊື່ຕໍ່ຮູບແບບ.
ໂດຍການຫຍໍ້ຄວາມຊັບຊ້ອນຂອງການວິເຄາະ PDF, ການສ້າງຮູບແບບຄືນໃໝ່, ແລະ ຄວາມແຕກຕ່າງດ້ານພາສາ, API ຂອງພວກເຮົາຊ່ວຍໃຫ້ທ່ານສາມາດສຸມໃສ່ເຫດຜົນຂອງແອັບພລິເຄຊັນຫຼັກຂອງທ່ານ.

ສະຖາປັດຕະຍະກໍາທີ່ທັນສະໄໝ, ແບບ RESTful

ສ້າງຂຶ້ນບົນຫຼັກການ REST, Doctranslate API ຮັບປະກັນການເຊື່ອມໂຍງແບບຊື່ໄປສູ່ເທັກໂນໂລຍີທີ່ທັນສະໄໝໃດໆ.
ຜູ້ພັດທະນາສາມາດພົວພັນກັບບໍລິການໂດຍໃຊ້ຄໍາຮ້ອງຂໍ HTTP ມາດຕະຖານ, ເຮັດໃຫ້ມັນງ່າຍທີ່ຈະໃຊ້ກັບພາສາການຂຽນໂປຣແກຣມໃດໆ, ຈາກ Python ແລະ Node.js ໄປຫາ Java ແລະ C#.
ຈຸດປາຍ API ແມ່ນເຂົ້າໃຈງ່າຍ ແລະ ມີເອກະສານຄົບຖ້ວນ, ຖືກອອກແບບມາເພື່ອສະໜອງປະສົບການຜູ້ພັດທະນາທີ່ສາມາດຄາດເດົາໄດ້ ແລະ ສະໝໍ່າສະເໝີຕັ້ງແຕ່ເລີ່ມຕົ້ນ.

ການຕອບສະໜອງຖືກສົ່ງໃນຮູບແບບ JSON ທີ່ສະອາດ, ເຊິ່ງມີນໍ້າໜັກເບົາແລະງ່າຍຕໍ່ການວິເຄາະແບບທົ່ວໄປ.
ນີ້ເຮັດໃຫ້ຂະບວນການຈັດການການຕອບສະໜອງ API, ການກວດສອບສະຖານະການແປ, ແລະ ການເອົາເອກະສານທີ່ຖືກແປສຸດທ້າຍມາໄດ້ງ່າຍຂຶ້ນ.
ຂະບວນການເຮັດວຽກທັງໝົດຖືກອອກແບບມາໃຫ້ເປັນແບບ asynchronous, ຊ່ວຍໃຫ້ແອັບພລິເຄຊັນຂອງທ່ານສາມາດສົ່ງວຽກແປໄດ້ໂດຍບໍ່ຕ້ອງຕັນ, ເຊິ່ງເປັນສິ່ງຈຳເປັນສຳລັບການສ້າງປະສົບການຂອງຜູ້ໃຊ້ທີ່ຕອບສະໜອງໄດ້ດີແລະສາມາດຂະຫຍາຍໄດ້.

ເຕັກໂນໂລຢີຮັກສາຮູບແບບທີ່ບໍ່ມີໃຜທຽບເທົ່າ

ຫົວໃຈຫຼັກຂອງ Doctranslate API ແມ່ນເຄື່ອງຈັກຮັກສາຮູບແບບທີ່ທັນສະໄໝ.
ລະບົບຂອງພວກເຮົາໄປໄກກວ່າການທົດແທນຂໍ້ຄວາມແບບງ່າຍດາຍ, ໂດຍການວິເຄາະໂຄງສ້າງເອກະສານທັງໝົດເພື່ອຮັບປະກັນວ່າສະບັບທີ່ແປແລ້ວແມ່ນແບບຈຳລອງທາງສາຍຕາທີ່ແທ້ຈິງຂອງຕົ້ນສະບັບ.
ເຕັກໂນໂລຢີນີ້ຈັດຮູບແບບຂໍ້ຄວາມຄືນໃໝ່ຢ່າງສະຫຼາດ, ປັບຂະໜາດຄໍລຳໃນຕາຕະລາງ, ແລະ ຈັດອົງປະກອບກຣາຟິກຄືນໃໝ່ເພື່ອຮອງຮັບເນື້ອຫາໃໝ່ຢ່າງສົມບູນ. ສໍາລັບຜູ້ພັດທະນາທີ່ຕ້ອງການແປເອກະສານດ້ວຍຄວາມແມ່ນຍໍາ, ເຕັກໂນໂລຢີຂອງພວກເຮົາຊ່ວຍໃຫ້ທ່ານ Giữ nguyên layout, bảng biểu, ຮັບປະກັນວ່າຕາຕະລາງແລະຮູບແບບທີ່ຊັບຊ້ອນຍັງຄົງຢູ່ຄືເກົ່າຫຼັງຈາກການແປ).

ການປະມວນຜົນທີ່ປອດໄພ, ສາມາດຂະຫຍາຍໄດ້, ແລະ ແບບ Asynchronous

ຄວາມປອດໄພແມ່ນສຳຄັນທີ່ສຸດເມື່ອຈັດການເອກະສານທີ່ລະອຽດອ່ອນ, ແລະ API ຂອງພວກເຮົາຖືກສ້າງຂຶ້ນດ້ວຍຫຼັກການນີ້ເປັນຫຼັກ.
ຂໍ້ມູນທັງໝົດຖືກສົ່ງຜ່ານການເຊື່ອມຕໍ່ທີ່ຖືກເຂົ້າລະຫັດ (HTTPS), ແລະ ໄຟລ໌ຂອງທ່ານຖືກປະມວນຜົນໃນສະພາບແວດລ້ອມທີ່ປອດໄພ, ແຍກອອກ.
ລັກສະນະ asynchronous ຂອງ API ໝາຍຄວາມວ່າທ່ານສາມາດສົ່ງເອກະສານເພື່ອແປ ແລະ ໄດ້ຮັບ ID ວຽກ, ຈາກນັ້ນກວດສອບຜົນໄດ້ຮັບ, ເຊິ່ງເໝາະສຳລັບການຈັດການໄຟລ໌ຂະໜາດໃຫຍ່ໂດຍບໍ່ມີການໝົດເວລາ (timeouts).

ສະຖາປັດຕະຍະກໍານີ້ຖືກອອກແບບມາສໍາລັບການຂະຫຍາຍທີ່ສູງ, ສາມາດປະມວນຜົນເອກະສານຫຼາຍພັນສະບັບພ້ອມກັນໂດຍບໍ່ມີການຫຼຸດລົງຂອງປະສິດທິພາບ.
ບໍ່ວ່າທ່ານກຳລັງແປໃບແຈ້ງໜີ້ໜ້າດຽວ ຫຼື ຄູ່ມືດ້ານເທັກນິກໜຶ່ງພັນໜ້າ, API ສະໜອງຜົນໄດ້ຮັບທີ່ສອດຄ່ອງແລະເຊື່ອຖືໄດ້.
ນີ້ເຮັດໃຫ້ມັນເໝາະສົມຢ່າງຍິ່ງສຳລັບແອັບພລິເຄຊັນລະດັບວິສາຫະກິດທີ່ຕ້ອງການປະສິດທິພາບສູງ ແລະ ຄວາມໜ້າເຊື່ອຖືທີ່ບໍ່ປ່ຽນແປງສຳລັບຂະບວນການເຮັດວຽກຂອງເອກະສານຂອງພວກເຂົາ.

ຄູ່ມືການເຊື່ອມໂຍງແບບເທື່ອລະຂັ້ນຕອນ

ການເຊື່ອມໂຍງ Doctranslate API ເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານເປັນຂະບວນການທີ່ຊື່ໄປຊື່ມາ.
ຄູ່ມືນີ້ຈະນໍາພາທ່ານຜ່ານຂັ້ນຕອນທີ່ຈໍາເປັນໂດຍໃຊ້ Python, ເຊິ່ງເປັນພາສາທີ່ນິຍົມສໍາລັບການພັດທະນາ backend ແລະ scripting.
ທ່ານຈະຕ້ອງມີ API key ທີ່ເປັນເອກະລັກຂອງທ່ານ, ເຊິ່ງທ່ານສາມາດໄດ້ຮັບຈາກແຜງຄວບຄຸມຜູ້ພັດທະນາ Doctranslate ຂອງທ່ານ.

ຂັ້ນຕອນທີ 1: ການຕັ້ງຄ່າສະພາບແວດລ້ອມຂອງທ່ານ

ກ່ອນທີ່ທ່ານຈະເລີ່ມຕົ້ນ, ໃຫ້ແນ່ໃຈວ່າທ່ານໄດ້ຕິດຕັ້ງ Python ໃນລະບົບຂອງທ່ານພ້ອມກັບຫ້ອງສະໝຸດ `requests` ທີ່ນິຍົມ.
ຫ້ອງສະໝຸດ `requests` ເຮັດໃຫ້ຂະບວນການສ້າງຄໍາຮ້ອງຂໍ HTTP ງ່າຍຂຶ້ນ, ເຊິ່ງເປັນວິທີທີ່ທ່ານຈະຕິດຕໍ່ສື່ສານກັບ Doctranslate API.
ທ່ານສາມາດຕິດຕັ້ງມັນໄດ້ງ່າຍໂດຍໃຊ້ pip, ຕົວຕິດຕັ້ງແພັກເກັດ Python, ໂດຍການສັ່ງ `pip install requests` ໃນ terminal ຂອງທ່ານ.

ເມື່ອຕິດຕັ້ງແລ້ວ, ທ່ານຄວນເກັບຮັກສາ API key ຂອງທ່ານໄວ້ຢ່າງປອດໄພ, ຕົວຢ່າງເຊັ່ນ, ເປັນຕົວແປສະພາບແວດລ້ອມ.
ຫຼີກລ້ຽງການຕັ້ງຂໍ້ມູນປະຈໍາຕົວທີ່ລະອຽດອ່ອນໂດຍກົງໃນລະຫັດແຫຼ່ງຂອງທ່ານສໍາລັບການປະຕິບັດທີ່ດີທີ່ສຸດດ້ານຄວາມປອດໄພ.
ສໍາລັບຕົວຢ່າງນີ້, ພວກເຮົາຈະສົມມຸດວ່າ API key ຂອງທ່ານຖືກເກັບໄວ້ໃນຕົວແປທີ່ມີຊື່ວ່າ `API_KEY` ເພື່ອຄວາມຊັດເຈນແລະງ່າຍຕໍ່ການນໍາໃຊ້.

ຂັ້ນຕອນທີ 2: ການກະກຽມຄໍາຮ້ອງຂໍ API

ຫຼັກຂອງການເຊື່ອມໂຍງແມ່ນຄໍາຮ້ອງຂໍ `POST` ໄປຫາຈຸດປາຍ `/v3/translate/document`.
ຄໍາຮ້ອງຂໍນີ້ຈະເປັນຄໍາຮ້ອງຂໍ multipart/form-data, ເນື່ອງຈາກທ່ານຈໍາເປັນຕ້ອງອັບໂຫລດໄຟລ໌ PDF ຕົວຈິງເປັນສ່ວນຫນຶ່ງຂອງ body.
ນອກຈາກນີ້, ທ່ານຕ້ອງລວມເອົາພາລາມິເຕີທີ່ຈໍາເປັນເຊັ່ນ: ພາສາຕົ້ນສະບັບ, ພາສາເປົ້າໝາຍ, ແລະ ໄຟລ໌ເອງ.

headers ຄຳຮ້ອງຂໍຂອງທ່ານຕ້ອງປະກອບມີ `x-api-key` ຂອງທ່ານສຳລັບການພິສູດຢືນຢັນ.
body ຈະປະກອບດ້ວຍຄູ່ຄ່າ-ຄີ (key-value pairs) ສໍາລັບ `source_lang` (‘en’), `target_lang` (‘nl’), ແລະ ຂໍ້ມູນ `file`.
ໃຫ້ເບິ່ງຕົວຢ່າງລະຫັດ Python ທີ່ສົມບູນທີ່ຫຸ້ມຫໍ່ເຫດຜົນນີ້ເຂົ້າໄປໃນ script ທີ່ງ່າຍດາຍ, ສາມາດນໍາໃຊ້ຄືນໄດ້.

ຂັ້ນຕອນທີ 3: ການສົ່ງ PDF ແລະ ການຈັດການການຕອບສະໜອງ

ລະຫັດ Python ຕໍ່ໄປນີ້ສະແດງໃຫ້ເຫັນວິທີການອັບໂຫລດໄຟລ໌ PDF ສໍາລັບການແປຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌.
ມັນສົ່ງຄໍາຮ້ອງຂໍ, ກວດສອບສໍາລັບການສົ່ງທີ່ສໍາເລັດ, ແລະ ຈາກນັ້ນສະແດງວິທີການກວດສອບຜົນໄດ້ຮັບ.
ຮູບແບບ asynchronous ນີ້ເປັນສິ່ງຈໍາເປັນສໍາລັບການຈັດການການແປທີ່ອາດຈະໃຊ້ເວລາບາງເວລາໃນການສໍາເລັດ, ຂຶ້ນກັບຂະຫນາດແລະຄວາມຊັບຊ້ອນຂອງເອກະສານ.

import requests
import time
import os

# Securely load your API key (e.g., from an environment variable)
API_KEY = os.getenv("DOCTRANSLATE_API_KEY", "your_api_key_here")
API_URL = "https://developer.doctranslate.io/v3/translate/document"

# Path to the document you want to translate
file_path = "path/to/your/document.pdf"

def translate_document(path):
    """Submits a document for translation and polls for the result."""
    headers = {
        "x-api-key": API_KEY
    }
    
    # Open the file in binary read mode
    with open(path, 'rb') as f:
        files = {
            'file': (os.path.basename(path), f, 'application/pdf')
        }
        data = {
            'source_lang': 'en',
            'target_lang': 'nl',
            'tone': 'formal' # Optional: specify tone for better Dutch translation
        }
        
        # Initial request to start the translation
        print("Uploading document for translation...")
        response = requests.post(API_URL, headers=headers, files=files, data=data)

    if response.status_code != 200:
        print(f"Error submitting document: {response.text}")
        return

    # The initial response contains URLs to poll for status and retrieve the result
    response_data = response.json()
    status_url = response_data.get("status_url")
    result_url = response_data.get("result_url")
    print(f"Document submitted successfully. Status URL: {status_url}")

    # Poll the status URL until the translation is complete
    while True:
        status_response = requests.get(status_url, headers=headers)
        status_data = status_response.json()
        current_status = status_data.get("status")
        print(f"Current translation status: {current_status}")

        if current_status == "done":
            print("Translation finished. Downloading result...")
            download_translated_file(result_url, headers)
            break
        elif current_status == "error":
            print(f"An error occurred during translation: {status_data.get('message')}")
            break

        # Wait for 10 seconds before polling again
        time.sleep(10)

def download_translated_file(url, headers):
    """Downloads the translated document from the result URL."""
    download_response = requests.get(url, headers=headers)
    if download_response.status_code == 200:
        # Construct a new filename for the translated document
        translated_filename = "translated_document_nl.pdf"
        with open(translated_filename, 'wb') as f:
            f.write(download_response.content)
        print(f"Successfully downloaded translated file to {translated_filename}")
    else:
        print(f"Failed to download file: {download_response.text}")

# Start the translation process
if __name__ == "__main__":
    if "your_api_key_here" in API_KEY:
        print("Please replace 'your_api_key_here' with your actual API key.")
    else:
        translate_document(file_path)

ຂໍ້ຄວນພິຈາລະນາທີ່ສຳຄັນສຳລັບລາຍລະອຽດສະເພາະຂອງພາສາດັດຊ໌

ການແປຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌ ກ່ຽວຂ້ອງກັບຫຼາຍກວ່າການປ່ຽນຄໍາສັບ; ມັນຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈກ່ຽວກັບຄວາມແຕກຕ່າງດ້ານພາສາ.
ການແປທີ່ມີຄຸນນະພາບສູງຕ້ອງຄໍານຶງເຖິງໄວຍະກອນ, ນໍ້າສຽງ, ແລະ ບໍລິບົດທາງດ້ານວັດທະນະທໍາເພື່ອໃຫ້ມີປະສິດທິພາບແລະສຽງເປັນທໍາມະຊາດສໍາລັບຜູ້ເວົ້າພື້ນເມືອງ.
Doctranslate API ໄດ້ຖືກຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່ເພື່ອຈັດການຄວາມລະອຽດອ່ອນເຫຼົ່ານີ້, ແຕ່ຜູ້ພັດທະນາສາມາດເພີ່ມຄຸນນະພາບຕື່ມອີກໂດຍການນໍາໃຊ້ພາລາມິເຕີ API ສະເພາະ.

ນໍ້າສຽງທາງການ ທຽບກັບ ນໍ້າສຽງບໍ່ເປັນທາງການ (‘u’ ທຽບກັບ ‘jij’)

ພາສາດັດຊ໌ມີຄວາມແຕກຕ່າງກັນຢ່າງຊັດເຈນລະຫວ່າງຮູບແບບທີ່ເປັນທາງການ (‘u’) ແລະ ບໍ່ເປັນທາງການ (‘jij’/’je’) ຂອງຄໍາວ່າ ‘ເຈົ້າ’.
ການໃຊ້ຮູບແບບທີ່ຜິດພາດສາມາດເຮັດໃຫ້ເອກະສານທາງທຸລະກິດຟັງຄືກັບບໍ່ເປັນມືອາຊີບ ຫຼື ເນື້ອຫາທຳມະດາຮູ້ສຶກແຂງກະດ້າງ ແລະ ຫ່າງໄກເກີນໄປ.
ນີ້ແມ່ນຂໍ້ຄວນພິຈາລະນາທີ່ສໍາຄັນສໍາລັບເນື້ອຫາທີ່ຜູ້ໃຊ້ເຫັນ, ເອກະສານທາງກົດໝາຍ, ແລະ ເຄື່ອງມືການຕະຫຼາດທີ່ນໍ້າສຽງທີ່ຖືກຕ້ອງເປັນສິ່ງຈໍາເປັນສໍາລັບການສື່ສານ.

Doctranslate API ແກ້ໄຂບັນຫານີ້ໂດຍກົງຜ່ານພາລາມິເຕີ `tone`, ເຊິ່ງທ່ານສາມາດຕັ້ງເປັນ `formal` ຫຼື `informal`.
ໂດຍການລະບຸ ນໍ້າສຽງທີ່ຕ້ອງການໃນຄໍາຮ້ອງຂໍ API ຂອງທ່ານ, ທ່ານນໍາພາເຄື່ອງຈັກການແປເພື່ອເລືອກຄໍາແທນນາມ ແລະ ປະໂຫຍກທີ່ເໝາະສົມ.
ພາລາມິເຕີທີ່ງ່າຍດາຍນີ້ສະຫນອງວິທີການທີ່ມີປະສິດທິພາບເພື່ອຮັບປະກັນວ່າ PDFs ທີ່ຖືກແປຂອງທ່ານສອດຄ່ອງຢ່າງສົມບູນກັບກຸ່ມເປົ້າໝາຍແລະບໍລິບົດທີ່ຕັ້ງໃຈ.

ຄໍາປະສົມ ແລະ ເພດທາງໄວຍະກອນ

ພາສາດັດຊ໌ເປັນທີ່ຮູ້ຈັກກັນໃນນາມຄໍາປະສົມທີ່ຍາວນານ, ບ່ອນທີ່ຄໍານາມຫຼາຍຄໍາຖືກເຂົ້າຮ່ວມເພື່ອກາຍເປັນຄໍາໃໝ່ຄໍາໜຶ່ງ.
ຕົວຢ່າງ, ‘credit card security’ ກາຍເປັນ ‘creditcardbeveiliging’.
ເຄື່ອງຈັກການແປຕ້ອງສາມາດກໍານົດໄດ້ຢ່າງຖືກຕ້ອງວ່າຈະຄວນລວມຄໍາສັບຕ່າງໆເມື່ອໃດ, ເນື່ອງຈາກການແຍກຫຼືການເວັ້ນຊ່ອງຫວ່າງທີ່ບໍ່ຖືກຕ້ອງສາມາດປ່ຽນຄວາມໝາຍຫຼືສຽງບໍ່ເປັນທໍາມະຊາດ.

ນອກຈາກນັ້ນ, ຄໍານາມພາສາດັດຊ໌ມີເພດທາງໄວຍະກອນ (de/het), ເຊິ່ງສົ່ງຜົນກະທົບຕໍ່ຄໍານໍາໜ້າ ແລະ ຄໍາຄຸນນາມທີ່ໃຊ້ກັບພວກມັນ.
ໃນຂະນະທີ່ນີ້ແມ່ນກົດລະບຽບທາງໄວຍະກອນທີ່ຊັບຊ້ອນ, ຮູບແບບການແປທີ່ມີຄວາມສາມາດເຊັ່ນ: ອັນທີ່ຂັບເຄື່ອນ Doctranslate ສາມາດຈັດການການມອບໝາຍເຫຼົ່ານີ້ໄດ້ຢ່າງຖືກຕ້ອງ.
API ຂອງພວກເຮົາຮັບປະກັນວ່າຂໍ້ຄວາມສຸດທ້າຍບໍ່ພຽງແຕ່ຖືກຕ້ອງໃນຄວາມໝາຍເທົ່ານັ້ນ ແຕ່ຍັງຖືກຕ້ອງຕາມຫຼັກໄວຍາກອນ ແລະ ລຽບງ່າຍ.

ການນໍາໃຊ້ຄໍາສັບສະເພາະດ້ານ (Domain-Specific Glossaries)

ສຳລັບຂົງເຂດດ້ານເທັກນິກສູງ ເຊັ່ນ: ກົດໝາຍ, ການແພດ, ຫຼື ວິສະວະກຳ, ຄຳສັບສະເພາະຕ້ອງຖືກແປຢ່າງສອດຄ່ອງ.
ການແປຈຸດປະສົງທົ່ວໄປອາດຈະບໍ່ສາມາດຈັບຄວາມໝາຍທີ່ແນ່ນອນຂອງຄຳສັບພາຍໃນຂົງເຂດສະເພາະໃດໜຶ່ງໄດ້.
ນີ້ສາມາດນໍາໄປສູ່ຄວາມຄຸມເຄືອ ຫຼື, ໃນຄໍາຮ້ອງສະຫມັກທີ່ສໍາຄັນ, ຄວາມບໍ່ຖືກຕ້ອງທີ່ອັນຕະລາຍໃນເອກະສານສຸດທ້າຍ.

Doctranslate ສະຫນອງຄຸນສົມບັດຕ່າງໆເຊັ່ນ: ການປັບຕົວໂດເມນ ແລະ ການຮອງຮັບຄໍາສັບເພື່ອແກ້ໄຂບັນຫານີ້.
ໂດຍການລະບຸ `domain` (ເຊັ່ນ, ‘medical’, ‘legal’) ຫຼື ການສະຫນອງຄໍາສັບແບບກໍານົດເອງ, ທ່ານສາມາດຮັບປະກັນວ່າຄໍາສັບຫຼັກຖືກແປຕາມຄວາມຕ້ອງການສະເພາະຂອງທ່ານສະເໝີ.
ລະດັບການຄວບຄຸມນີ້ແມ່ນຈໍາເປັນຢ່າງຍິ່ງສໍາລັບອົງການຈັດຕັ້ງທີ່ຕ້ອງການການແປທີ່ຖືກຕ້ອງຕາມການຮັບຮອງສໍາລັບເອກະສານດ້ານເທັກນິກ, ສັນຍາ, ແລະ ບົດລາຍງານຂອງພວກເຂົາ.

ສະຫຼຸບ ແລະ ຂັ້ນຕອນຕໍ່ໄປ

ການເຊື່ອມໂຍງ PDF Translation API ທີ່ມີປະສິດທິພາບສໍາລັບການປ່ຽນແປງຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌ ສາມາດເລັ່ງຂະບວນການເຮັດວຽກສາກົນຂອງທ່ານໄດ້ຢ່າງຫຼວງຫຼາຍ.
Doctranslate API ສະໜອງໂຊລູຊັ່ນທີ່ສົມບູນແບບທີ່ຈັດການກັບຄວາມຊັບຊ້ອນທາງດ້ານເຕັກນິກອັນໃຫຍ່ຫຼວງຂອງການຈັດການ PDF ແລະ ສະໜອງການແປທີ່ລະອຽດອ່ອນທາງດ້ານພາສາ.
ດ້ວຍສະຖາປັດຕະຍະກໍາ RESTful, ການຮັກສາຮູບແບບທີ່ເຂັ້ມແຂງ, ແລະ ຄຸນສົມບັດສໍາລັບການຈັດການລາຍລະອຽດສະເພາະຂອງພາສາ, ມັນເຮັດໃຫ້ຜູ້ພັດທະນາສາມາດສ້າງແອັບພລິເຄຊັນທົ່ວໂລກທີ່ມີຄວາມຊັບຊ້ອນໄດ້.

ໂດຍການປະຕິບັດຕາມຄູ່ມືການເຊື່ອມໂຍງທີ່ສະໜອງໃຫ້, ທ່ານສາມາດເພີ່ມຄວາມສາມາດໃນການແປເອກະສານທີ່ມີຄຸນນະພາບສູງເຂົ້າໃນບໍລິການຂອງທ່ານໄດ້ຢ່າງວ່ອງໄວ.
ພວກ​ເຮົາ​ຊຸກ​ຍູ້​ໃຫ້​ທ່ານ​ສຳ​ຫຼວດ​ເອ​ກະ​ສານ Doctranslate API ຢ່າງ​ເປັນ​ທາງ​ການ ເພື່ອ​ຄົ້ນ​ພົບ​ຄຸນ​ສົມ​ບັດ​ຂັ້ນ​ສູງ​ເພີ່ມ​ເຕີມ, ເຊັ່ນ: ການ​ສ້າງ​ເອ​ກະ​ສານ​ສອງ​ພາ​ສາ ແລະ ຄູ່​ພາ​ສາ​ເພີ່ມ​ເຕີມ.
ເລີ່ມຕົ້ນການສ້າງໃນມື້ນີ້ເພື່ອເຊື່ອມຕໍ່ສິ່ງກີດຂວາງທາງດ້ານພາສາ ແລະ ນໍາສົ່ງເນື້ອຫາຂອງທ່ານໄປສູ່ຜູ້ຊົມທົ່ວໂລກດ້ວຍຄວາມຫມັ້ນໃຈແລະຄວາມແມ່ນຍໍາ.

Doctranslate.io - ການແປທີ່ວ່ອງໄວ, ຖືກຕ້ອງໃນທົ່ວຫຼາຍພາສາ

Tinggalkan Komen

chat