ຜູ້ພັດທະນາຫຼາຍຄັ້ງປະເຊີນກັບສິ່ງທ້າທາຍທີ່ສໍາຄັນເມື່ອໄດ້ຮັບມອບໝາຍການແປເອກະສານແບບໂປຣແກຣມມິຕ.
ຄວາມຕ້ອງການສໍາລັບໂຊລູຊັ່ນ PDF Translation API ອັງກິດ ເຖິງ ດັດຊ໌ ທີ່ເຂັ້ມແຂງແມ່ນນັບມື້ນັບເພີ່ມຂຶ້ນ, ໂດຍສະເພາະສຳລັບທຸລະກິດທີ່ກຳລັງຂະຫຍາຍໄປສູ່ ເນເທີແລນ ແລະ ແບນຊິກ.
ຄູ່ມືນີ້ຈະສະໜອງການຍ່າງຜ່ານທີ່ສົມບູນແບບຂອງອຸປະສັກທາງດ້ານເຕັກນິກທີ່ກ່ຽວຂ້ອງ ແລະ ນຳສະເໜີໂຊລູຊັ່ນທີ່ມີປະສິດທິພາບ ແລະ ເປັນມິດກັບຜູ້ພັດທະນາ ເພື່ອບັນລຸການເຊື່ອມໂຍງທີ່ບໍ່ມີຮອຍຕໍ່.
ເປັນຫຍັງການແປ PDF ຜ່ານ API ຈຶ່ງຍາກໂດຍທຳມະຊາດ
ຮູບແບບເອກະສານແບບພົກພາ (PDF) ໄດ້ຖືກອອກແບບມາສໍາລັບການນໍາສະເໜີເນື້ອໃນ, ບໍ່ແມ່ນສໍາລັບການສະກັດເອົາຂໍ້ມູນ ຫຼື ການຈັດການຂໍ້ມູນໄດ້ງ່າຍ.
ຫຼັກການພື້ນຖານນີ້ສ້າງອຸປະສັກຈຳນວນຫຼາຍສຳລັບລະບົບການແປແບບອັດຕະໂນມັດ, ຮຽກຮ້ອງໃຫ້ມີວິສະວະກຳທີ່ຊັບຊ້ອນເພື່ອເອົາຊະນະສິ່ງທ້າທາຍເຫຼົ່ານັ້ນຢ່າງມີປະສິດທິພາບ.
ການເຂົ້າໃຈສິ່ງທ້າທາຍຫຼັກເຫຼົ່ານີ້ເນັ້ນໃຫ້ເຫັນວ່າເປັນຫຍັງ API ສະເພາະຈຶ່ງບໍ່ແມ່ນພຽງແຕ່ຄວາມສະດວກສະບາຍເທົ່ານັ້ນ ແຕ່ເປັນສິ່ງຈຳເປັນສຳລັບຜົນໄດ້ຮັບທີ່ເຊື່ອຖືໄດ້.
ສິ່ງທ້າທາຍຂອງການເຂົ້າລະຫັດແບບ Binary ແລະ ໂຄງສ້າງ
ບໍ່ເໝືອນກັບຂໍ້ຄວາມທໍາມະດາ ຫຼື HTML, PDF ແມ່ນໄຟລ໌ binary ທີ່ຊັບຊ້ອນ, ຄ້າຍຄືກັບໂປຣແກຣມທີ່ຖືກລວບລວມສໍາລັບເຄື່ອງພິມສະເໝືອນ.
ເນື້ອໃນຂອງມັນບໍ່ໄດ້ຖືກເກັບໄວ້ໃນກະແສທີ່ສາມາດອ່ານໄດ້ເປັນເສັ້ນຊື່ ແຕ່ປະກອບດ້ວຍວັດຖຸ, ກະແສ, ແລະ ຕາຕະລາງການອ້າງອິງຂ້າມທີ່ກໍານົດຮູບແບບຂອງເອກະສານ.
ການວິເຄາະໂຄງສ້າງນີ້ເພື່ອສະກັດຂໍ້ຄວາມສໍາລັບການແປໄດ້ຢ່າງຖືກຕ້ອງ, ໃນຂະນະທີ່ບໍ່ສົນໃຈຂໍ້ມູນທີ່ບໍ່ແມ່ນຂໍ້ຄວາມ, ແມ່ນອຸປະສັກສໍາຄັນທໍາອິດທີ່ລະບົບອັດຕະໂນມັດຕ້ອງໄດ້ຜ່ານໄປ.
ການສະກັດຂໍ້ຄວາມອອກຈາກຮູບແບບ binary ນີ້ຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈຢ່າງເລິກເຊິ່ງກ່ຽວກັບສະເພາະຂອງ PDF, ເຊິ່ງມີຄວາມຍາວຫຼາຍຮ້ອຍໜ້າ.
ເຄື່ອງຂູດຂໍ້ຄວາມງ່າຍໆຈະລົ້ມເຫຼວ, ເນື່ອງຈາກພວກມັນບໍ່ສາມາດຕີຄວາມຄຳສັ່ງຂອງການສະແດງຜົນທີ່ວາງຕົວອັກສອນ ແລະ ຄໍາສັບຕ່າງໆໃສ່ໃນໜ້າໄດ້.
API ທີ່ມີປະສິດທິພາບຕ້ອງມີເຄື່ອງຈັກວິເຄາະທີ່ມີພະລັງທີ່ສາມາດສ້າງກະແສຂໍ້ຄວາມທີ່ມີເຫດຜົນຄືນໃໝ່ຈາກຄໍາສັ່ງທີ່ຊັບຊ້ອນເຫຼົ່ານີ້ກ່ອນທີ່ການແປຈະສາມາດເລີ່ມຕົ້ນໄດ້.
ການຮັກສາຮູບແບບ, ຕາຕະລາງ, ແລະ ຮູບພາບທີ່ຊັບຊ້ອນ
ຂໍ້ໄດ້ປຽບຕົ້ນຕໍຂອງຮູບແບບ PDF ແມ່ນຄວາມສາມາດໃນການຮັກສາຮູບແບບຄົງທີ່ໃນທົ່ວທຸກອຸປະກອນແລະລະບົບປະຕິບັດການ.
ຄຸນສົມບັດນີ້ກາຍເປັນສິ່ງທ້າທາຍທີ່ສໍາຄັນໃນລະຫວ່າງການແປ, ເນື່ອງຈາກຂໍ້ຄວາມທີ່ແປແລ້ວບໍ່ຄ່ອຍມີຄວາມຍາວເທົ່າກັບຂໍ້ຄວາມຕົ້ນສະບັບ.
ຕົວຢ່າງ, ຄໍາສັບພາສາດັດຊ໌ອາດຈະຍາວຂຶ້ນຢ່າງຫຼວງຫຼາຍເມື່ອທຽບກັບຄໍາສັບພາສາອັງກິດ, ເຊິ່ງສາມາດເຮັດໃຫ້ຂໍ້ຄວາມລົ້ນຂອບເຂດທີ່ຖືກກໍານົດໄວ້, ເຮັດໃຫ້ຕາຕະລາງ, ແຜນວາດ, ແລະການຈັດລຽງທາງດ້ານສາຍຕາເສຍຫາຍ.
ວິທີການແປແບບງ່າຍດາຍທີ່ພຽງແຕ່ປ່ຽນຂໍ້ຄວາມສະຕຣິງຈະທໍາລາຍລັກສະນະເປັນມືອາຊີບຂອງເອກະສານຢ່າງຫຼີກລ້ຽງບໍ່ໄດ້.
PDF translation API ທີ່ຊັບຊ້ອນຕ້ອງເຮັດຫຼາຍກວ່າການແປ; ມັນຕ້ອງປະຕິບັດຂະບວນການຈັດຮູບແບບຄືນໃໝ່ທີ່ຊັບຊ້ອນ.
ນີ້ກ່ຽວຂ້ອງກັບການຄິດໄລ່ຄືນໃໝ່ຂອງພິກັດ, ການປັບຂະໜາດຕົວອັກສອນ, ແລະ ການປັບຂະໜາດບລັອກເນື້ອຫາແບບເຄື່ອນໄຫວເພື່ອຮອງຮັບຂໍ້ຄວາມໃໝ່ ໃນຂະນະທີ່ຮັກສາຄວາມຄົງຕົວທາງສາຍຕາຕົ້ນສະບັບຂອງເອກະສານ.
ການຈັດການຕົວອັກສອນ, ຊຸດຕົວອັກສອນ, ແລະ ຮູບພາບ
ເອກະສານ PDF ສາມາດຝັງຕົວອັກສອນແບບກຳນົດເອງ, ເຊິ່ງອາດຈະບໍ່ຮອງຮັບຕົວອັກສອນທີ່ຕ້ອງການສຳລັບພາສາເປົ້າໝາຍ.
ຖ້າເອກະສານພາສາອັງກິດໃຊ້ຕົວອັກສອນທີ່ຂາດຕົວອັກສອນດັດຊ໌ທີ່ມີເຄື່ອງໝາຍ diacritics (ເຊັ່ນ ë ຫຼື ï), API ຕ້ອງທົດແທນມັນຢ່າງສະຫຼາດດ້ວຍທາງເລືອກທີ່ເໝາະສົມ.
ຂະບວນການທົດແທນຕົວອັກສອນນີ້ຈໍາເປັນຕ້ອງບໍ່ມີຮອຍຕໍ່ເພື່ອຫຼີກເວັ້ນການປ່ຽນແປງທາງສາຍຕາທີ່ກະທົບກະເທືອນ ຫຼື ຂໍ້ຜິດພາດໃນການສະແດງຜົນທີ່ຮູ້ຈັກກັນໃນນາມ ‘tofu’ (ກ່ອງເປົ່າ) ບ່ອນທີ່ຕົວອັກສອນຄວນຢູ່.
ນອກຈາກນັ້ນ, ຂໍ້ຄວາມສາມາດຖືກຝັງຢູ່ພາຍໃນຮູບພາບ ຫຼື ກຣາຟິກ vector, ເຮັດໃຫ້ມັນເບິ່ງບໍ່ເຫັນຕໍ່ວິທີການສະກັດຂໍ້ຄວາມມາດຕະຖານ.
API ຂັ້ນສູງຈໍາເປັນຕ້ອງລວມເອົາເຕັກໂນໂລຢີ Optical Character Recognition (OCR) ເພື່ອກໍານົດແລະສະກັດຂໍ້ຄວາມທີ່ຖືກ rasterized ນີ້.
ຫຼັງຈາກການສະກັດແລະການແປ, API ຈະຕ້ອງສ້າງຮູບພາບຄືນໃໝ່ດ້ວຍຂໍ້ຄວາມທີ່ແປແລ້ວ, ໂດຍການຈັບຄູ່ພື້ນຫຼັງຕົ້ນສະບັບ, ຮູບແບບຕົວອັກສອນ, ແລະ ຕຳແໜ່ງຢ່າງລະມັດລະວັງ.
ຂໍແນະນຳ Doctranslate PDF Translation API
Doctranslate API ໄດ້ຖືກອອກແບບສະເພາະເພື່ອເອົາຊະນະສິ່ງທ້າທາຍທີ່ຊັບຊ້ອນຂອງການແປເອກະສານ PDF.
ມັນສະຫນອງໂຊລູຊັ່ນທີ່ເຂັ້ມແຂງ, ສາມາດຂະຫຍາຍໄດ້, ແລະ ເປັນມິດກັບຜູ້ພັດທະນາສໍາລັບການແປເອກະສານຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌ ດ້ວຍຄວາມຖືກຕ້ອງພິເສດ ແລະ ຄວາມສັດຊື່ຕໍ່ຮູບແບບ.
ໂດຍການຫຍໍ້ຄວາມຊັບຊ້ອນຂອງການວິເຄາະ PDF, ການສ້າງຮູບແບບຄືນໃໝ່, ແລະ ຄວາມແຕກຕ່າງດ້ານພາສາ, API ຂອງພວກເຮົາຊ່ວຍໃຫ້ທ່ານສາມາດສຸມໃສ່ເຫດຜົນຂອງແອັບພລິເຄຊັນຫຼັກຂອງທ່ານ.
ສະຖາປັດຕະຍະກໍາທີ່ທັນສະໄໝ, ແບບ RESTful
ສ້າງຂຶ້ນບົນຫຼັກການ REST, Doctranslate API ຮັບປະກັນການເຊື່ອມໂຍງແບບຊື່ໄປສູ່ເທັກໂນໂລຍີທີ່ທັນສະໄໝໃດໆ.
ຜູ້ພັດທະນາສາມາດພົວພັນກັບບໍລິການໂດຍໃຊ້ຄໍາຮ້ອງຂໍ HTTP ມາດຕະຖານ, ເຮັດໃຫ້ມັນງ່າຍທີ່ຈະໃຊ້ກັບພາສາການຂຽນໂປຣແກຣມໃດໆ, ຈາກ Python ແລະ Node.js ໄປຫາ Java ແລະ C#.
ຈຸດປາຍ API ແມ່ນເຂົ້າໃຈງ່າຍ ແລະ ມີເອກະສານຄົບຖ້ວນ, ຖືກອອກແບບມາເພື່ອສະໜອງປະສົບການຜູ້ພັດທະນາທີ່ສາມາດຄາດເດົາໄດ້ ແລະ ສະໝໍ່າສະເໝີຕັ້ງແຕ່ເລີ່ມຕົ້ນ.
ການຕອບສະໜອງຖືກສົ່ງໃນຮູບແບບ JSON ທີ່ສະອາດ, ເຊິ່ງມີນໍ້າໜັກເບົາແລະງ່າຍຕໍ່ການວິເຄາະແບບທົ່ວໄປ.
ນີ້ເຮັດໃຫ້ຂະບວນການຈັດການການຕອບສະໜອງ API, ການກວດສອບສະຖານະການແປ, ແລະ ການເອົາເອກະສານທີ່ຖືກແປສຸດທ້າຍມາໄດ້ງ່າຍຂຶ້ນ.
ຂະບວນການເຮັດວຽກທັງໝົດຖືກອອກແບບມາໃຫ້ເປັນແບບ asynchronous, ຊ່ວຍໃຫ້ແອັບພລິເຄຊັນຂອງທ່ານສາມາດສົ່ງວຽກແປໄດ້ໂດຍບໍ່ຕ້ອງຕັນ, ເຊິ່ງເປັນສິ່ງຈຳເປັນສຳລັບການສ້າງປະສົບການຂອງຜູ້ໃຊ້ທີ່ຕອບສະໜອງໄດ້ດີແລະສາມາດຂະຫຍາຍໄດ້.
ເຕັກໂນໂລຢີຮັກສາຮູບແບບທີ່ບໍ່ມີໃຜທຽບເທົ່າ
ຫົວໃຈຫຼັກຂອງ Doctranslate API ແມ່ນເຄື່ອງຈັກຮັກສາຮູບແບບທີ່ທັນສະໄໝ.
ລະບົບຂອງພວກເຮົາໄປໄກກວ່າການທົດແທນຂໍ້ຄວາມແບບງ່າຍດາຍ, ໂດຍການວິເຄາະໂຄງສ້າງເອກະສານທັງໝົດເພື່ອຮັບປະກັນວ່າສະບັບທີ່ແປແລ້ວແມ່ນແບບຈຳລອງທາງສາຍຕາທີ່ແທ້ຈິງຂອງຕົ້ນສະບັບ.
ເຕັກໂນໂລຢີນີ້ຈັດຮູບແບບຂໍ້ຄວາມຄືນໃໝ່ຢ່າງສະຫຼາດ, ປັບຂະໜາດຄໍລຳໃນຕາຕະລາງ, ແລະ ຈັດອົງປະກອບກຣາຟິກຄືນໃໝ່ເພື່ອຮອງຮັບເນື້ອຫາໃໝ່ຢ່າງສົມບູນ. ສໍາລັບຜູ້ພັດທະນາທີ່ຕ້ອງການແປເອກະສານດ້ວຍຄວາມແມ່ນຍໍາ, ເຕັກໂນໂລຢີຂອງພວກເຮົາຊ່ວຍໃຫ້ທ່ານ Giữ nguyên layout, bảng biểu, ຮັບປະກັນວ່າຕາຕະລາງແລະຮູບແບບທີ່ຊັບຊ້ອນຍັງຄົງຢູ່ຄືເກົ່າຫຼັງຈາກການແປ).
ການປະມວນຜົນທີ່ປອດໄພ, ສາມາດຂະຫຍາຍໄດ້, ແລະ ແບບ Asynchronous
ຄວາມປອດໄພແມ່ນສຳຄັນທີ່ສຸດເມື່ອຈັດການເອກະສານທີ່ລະອຽດອ່ອນ, ແລະ API ຂອງພວກເຮົາຖືກສ້າງຂຶ້ນດ້ວຍຫຼັກການນີ້ເປັນຫຼັກ.
ຂໍ້ມູນທັງໝົດຖືກສົ່ງຜ່ານການເຊື່ອມຕໍ່ທີ່ຖືກເຂົ້າລະຫັດ (HTTPS), ແລະ ໄຟລ໌ຂອງທ່ານຖືກປະມວນຜົນໃນສະພາບແວດລ້ອມທີ່ປອດໄພ, ແຍກອອກ.
ລັກສະນະ asynchronous ຂອງ API ໝາຍຄວາມວ່າທ່ານສາມາດສົ່ງເອກະສານເພື່ອແປ ແລະ ໄດ້ຮັບ ID ວຽກ, ຈາກນັ້ນກວດສອບຜົນໄດ້ຮັບ, ເຊິ່ງເໝາະສຳລັບການຈັດການໄຟລ໌ຂະໜາດໃຫຍ່ໂດຍບໍ່ມີການໝົດເວລາ (timeouts).
ສະຖາປັດຕະຍະກໍານີ້ຖືກອອກແບບມາສໍາລັບການຂະຫຍາຍທີ່ສູງ, ສາມາດປະມວນຜົນເອກະສານຫຼາຍພັນສະບັບພ້ອມກັນໂດຍບໍ່ມີການຫຼຸດລົງຂອງປະສິດທິພາບ.
ບໍ່ວ່າທ່ານກຳລັງແປໃບແຈ້ງໜີ້ໜ້າດຽວ ຫຼື ຄູ່ມືດ້ານເທັກນິກໜຶ່ງພັນໜ້າ, API ສະໜອງຜົນໄດ້ຮັບທີ່ສອດຄ່ອງແລະເຊື່ອຖືໄດ້.
ນີ້ເຮັດໃຫ້ມັນເໝາະສົມຢ່າງຍິ່ງສຳລັບແອັບພລິເຄຊັນລະດັບວິສາຫະກິດທີ່ຕ້ອງການປະສິດທິພາບສູງ ແລະ ຄວາມໜ້າເຊື່ອຖືທີ່ບໍ່ປ່ຽນແປງສຳລັບຂະບວນການເຮັດວຽກຂອງເອກະສານຂອງພວກເຂົາ.
ຄູ່ມືການເຊື່ອມໂຍງແບບເທື່ອລະຂັ້ນຕອນ
ການເຊື່ອມໂຍງ Doctranslate API ເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານເປັນຂະບວນການທີ່ຊື່ໄປຊື່ມາ.
ຄູ່ມືນີ້ຈະນໍາພາທ່ານຜ່ານຂັ້ນຕອນທີ່ຈໍາເປັນໂດຍໃຊ້ Python, ເຊິ່ງເປັນພາສາທີ່ນິຍົມສໍາລັບການພັດທະນາ backend ແລະ scripting.
ທ່ານຈະຕ້ອງມີ API key ທີ່ເປັນເອກະລັກຂອງທ່ານ, ເຊິ່ງທ່ານສາມາດໄດ້ຮັບຈາກແຜງຄວບຄຸມຜູ້ພັດທະນາ Doctranslate ຂອງທ່ານ.
ຂັ້ນຕອນທີ 1: ການຕັ້ງຄ່າສະພາບແວດລ້ອມຂອງທ່ານ
ກ່ອນທີ່ທ່ານຈະເລີ່ມຕົ້ນ, ໃຫ້ແນ່ໃຈວ່າທ່ານໄດ້ຕິດຕັ້ງ Python ໃນລະບົບຂອງທ່ານພ້ອມກັບຫ້ອງສະໝຸດ `requests` ທີ່ນິຍົມ.
ຫ້ອງສະໝຸດ `requests` ເຮັດໃຫ້ຂະບວນການສ້າງຄໍາຮ້ອງຂໍ HTTP ງ່າຍຂຶ້ນ, ເຊິ່ງເປັນວິທີທີ່ທ່ານຈະຕິດຕໍ່ສື່ສານກັບ Doctranslate API.
ທ່ານສາມາດຕິດຕັ້ງມັນໄດ້ງ່າຍໂດຍໃຊ້ pip, ຕົວຕິດຕັ້ງແພັກເກັດ Python, ໂດຍການສັ່ງ `pip install requests` ໃນ terminal ຂອງທ່ານ.
ເມື່ອຕິດຕັ້ງແລ້ວ, ທ່ານຄວນເກັບຮັກສາ API key ຂອງທ່ານໄວ້ຢ່າງປອດໄພ, ຕົວຢ່າງເຊັ່ນ, ເປັນຕົວແປສະພາບແວດລ້ອມ.
ຫຼີກລ້ຽງການຕັ້ງຂໍ້ມູນປະຈໍາຕົວທີ່ລະອຽດອ່ອນໂດຍກົງໃນລະຫັດແຫຼ່ງຂອງທ່ານສໍາລັບການປະຕິບັດທີ່ດີທີ່ສຸດດ້ານຄວາມປອດໄພ.
ສໍາລັບຕົວຢ່າງນີ້, ພວກເຮົາຈະສົມມຸດວ່າ API key ຂອງທ່ານຖືກເກັບໄວ້ໃນຕົວແປທີ່ມີຊື່ວ່າ `API_KEY` ເພື່ອຄວາມຊັດເຈນແລະງ່າຍຕໍ່ການນໍາໃຊ້.
ຂັ້ນຕອນທີ 2: ການກະກຽມຄໍາຮ້ອງຂໍ API
ຫຼັກຂອງການເຊື່ອມໂຍງແມ່ນຄໍາຮ້ອງຂໍ `POST` ໄປຫາຈຸດປາຍ `/v3/translate/document`.
ຄໍາຮ້ອງຂໍນີ້ຈະເປັນຄໍາຮ້ອງຂໍ multipart/form-data, ເນື່ອງຈາກທ່ານຈໍາເປັນຕ້ອງອັບໂຫລດໄຟລ໌ PDF ຕົວຈິງເປັນສ່ວນຫນຶ່ງຂອງ body.
ນອກຈາກນີ້, ທ່ານຕ້ອງລວມເອົາພາລາມິເຕີທີ່ຈໍາເປັນເຊັ່ນ: ພາສາຕົ້ນສະບັບ, ພາສາເປົ້າໝາຍ, ແລະ ໄຟລ໌ເອງ.
headers ຄຳຮ້ອງຂໍຂອງທ່ານຕ້ອງປະກອບມີ `x-api-key` ຂອງທ່ານສຳລັບການພິສູດຢືນຢັນ.
body ຈະປະກອບດ້ວຍຄູ່ຄ່າ-ຄີ (key-value pairs) ສໍາລັບ `source_lang` (‘en’), `target_lang` (‘nl’), ແລະ ຂໍ້ມູນ `file`.
ໃຫ້ເບິ່ງຕົວຢ່າງລະຫັດ Python ທີ່ສົມບູນທີ່ຫຸ້ມຫໍ່ເຫດຜົນນີ້ເຂົ້າໄປໃນ script ທີ່ງ່າຍດາຍ, ສາມາດນໍາໃຊ້ຄືນໄດ້.
ຂັ້ນຕອນທີ 3: ການສົ່ງ PDF ແລະ ການຈັດການການຕອບສະໜອງ
ລະຫັດ Python ຕໍ່ໄປນີ້ສະແດງໃຫ້ເຫັນວິທີການອັບໂຫລດໄຟລ໌ PDF ສໍາລັບການແປຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌.
ມັນສົ່ງຄໍາຮ້ອງຂໍ, ກວດສອບສໍາລັບການສົ່ງທີ່ສໍາເລັດ, ແລະ ຈາກນັ້ນສະແດງວິທີການກວດສອບຜົນໄດ້ຮັບ.
ຮູບແບບ asynchronous ນີ້ເປັນສິ່ງຈໍາເປັນສໍາລັບການຈັດການການແປທີ່ອາດຈະໃຊ້ເວລາບາງເວລາໃນການສໍາເລັດ, ຂຶ້ນກັບຂະຫນາດແລະຄວາມຊັບຊ້ອນຂອງເອກະສານ.
import requests import time import os # Securely load your API key (e.g., from an environment variable) API_KEY = os.getenv("DOCTRANSLATE_API_KEY", "your_api_key_here") API_URL = "https://developer.doctranslate.io/v3/translate/document" # Path to the document you want to translate file_path = "path/to/your/document.pdf" def translate_document(path): """Submits a document for translation and polls for the result.""" headers = { "x-api-key": API_KEY } # Open the file in binary read mode with open(path, 'rb') as f: files = { 'file': (os.path.basename(path), f, 'application/pdf') } data = { 'source_lang': 'en', 'target_lang': 'nl', 'tone': 'formal' # Optional: specify tone for better Dutch translation } # Initial request to start the translation print("Uploading document for translation...") response = requests.post(API_URL, headers=headers, files=files, data=data) if response.status_code != 200: print(f"Error submitting document: {response.text}") return # The initial response contains URLs to poll for status and retrieve the result response_data = response.json() status_url = response_data.get("status_url") result_url = response_data.get("result_url") print(f"Document submitted successfully. Status URL: {status_url}") # Poll the status URL until the translation is complete while True: status_response = requests.get(status_url, headers=headers) status_data = status_response.json() current_status = status_data.get("status") print(f"Current translation status: {current_status}") if current_status == "done": print("Translation finished. Downloading result...") download_translated_file(result_url, headers) break elif current_status == "error": print(f"An error occurred during translation: {status_data.get('message')}") break # Wait for 10 seconds before polling again time.sleep(10) def download_translated_file(url, headers): """Downloads the translated document from the result URL.""" download_response = requests.get(url, headers=headers) if download_response.status_code == 200: # Construct a new filename for the translated document translated_filename = "translated_document_nl.pdf" with open(translated_filename, 'wb') as f: f.write(download_response.content) print(f"Successfully downloaded translated file to {translated_filename}") else: print(f"Failed to download file: {download_response.text}") # Start the translation process if __name__ == "__main__": if "your_api_key_here" in API_KEY: print("Please replace 'your_api_key_here' with your actual API key.") else: translate_document(file_path)ຂໍ້ຄວນພິຈາລະນາທີ່ສຳຄັນສຳລັບລາຍລະອຽດສະເພາະຂອງພາສາດັດຊ໌
ການແປຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌ ກ່ຽວຂ້ອງກັບຫຼາຍກວ່າການປ່ຽນຄໍາສັບ; ມັນຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈກ່ຽວກັບຄວາມແຕກຕ່າງດ້ານພາສາ.
ການແປທີ່ມີຄຸນນະພາບສູງຕ້ອງຄໍານຶງເຖິງໄວຍະກອນ, ນໍ້າສຽງ, ແລະ ບໍລິບົດທາງດ້ານວັດທະນະທໍາເພື່ອໃຫ້ມີປະສິດທິພາບແລະສຽງເປັນທໍາມະຊາດສໍາລັບຜູ້ເວົ້າພື້ນເມືອງ.
Doctranslate API ໄດ້ຖືກຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່ເພື່ອຈັດການຄວາມລະອຽດອ່ອນເຫຼົ່ານີ້, ແຕ່ຜູ້ພັດທະນາສາມາດເພີ່ມຄຸນນະພາບຕື່ມອີກໂດຍການນໍາໃຊ້ພາລາມິເຕີ API ສະເພາະ.ນໍ້າສຽງທາງການ ທຽບກັບ ນໍ້າສຽງບໍ່ເປັນທາງການ (‘u’ ທຽບກັບ ‘jij’)
ພາສາດັດຊ໌ມີຄວາມແຕກຕ່າງກັນຢ່າງຊັດເຈນລະຫວ່າງຮູບແບບທີ່ເປັນທາງການ (‘u’) ແລະ ບໍ່ເປັນທາງການ (‘jij’/’je’) ຂອງຄໍາວ່າ ‘ເຈົ້າ’.
ການໃຊ້ຮູບແບບທີ່ຜິດພາດສາມາດເຮັດໃຫ້ເອກະສານທາງທຸລະກິດຟັງຄືກັບບໍ່ເປັນມືອາຊີບ ຫຼື ເນື້ອຫາທຳມະດາຮູ້ສຶກແຂງກະດ້າງ ແລະ ຫ່າງໄກເກີນໄປ.
ນີ້ແມ່ນຂໍ້ຄວນພິຈາລະນາທີ່ສໍາຄັນສໍາລັບເນື້ອຫາທີ່ຜູ້ໃຊ້ເຫັນ, ເອກະສານທາງກົດໝາຍ, ແລະ ເຄື່ອງມືການຕະຫຼາດທີ່ນໍ້າສຽງທີ່ຖືກຕ້ອງເປັນສິ່ງຈໍາເປັນສໍາລັບການສື່ສານ.Doctranslate API ແກ້ໄຂບັນຫານີ້ໂດຍກົງຜ່ານພາລາມິເຕີ `tone`, ເຊິ່ງທ່ານສາມາດຕັ້ງເປັນ `formal` ຫຼື `informal`.
ໂດຍການລະບຸ ນໍ້າສຽງທີ່ຕ້ອງການໃນຄໍາຮ້ອງຂໍ API ຂອງທ່ານ, ທ່ານນໍາພາເຄື່ອງຈັກການແປເພື່ອເລືອກຄໍາແທນນາມ ແລະ ປະໂຫຍກທີ່ເໝາະສົມ.
ພາລາມິເຕີທີ່ງ່າຍດາຍນີ້ສະຫນອງວິທີການທີ່ມີປະສິດທິພາບເພື່ອຮັບປະກັນວ່າ PDFs ທີ່ຖືກແປຂອງທ່ານສອດຄ່ອງຢ່າງສົມບູນກັບກຸ່ມເປົ້າໝາຍແລະບໍລິບົດທີ່ຕັ້ງໃຈ.ຄໍາປະສົມ ແລະ ເພດທາງໄວຍະກອນ
ພາສາດັດຊ໌ເປັນທີ່ຮູ້ຈັກກັນໃນນາມຄໍາປະສົມທີ່ຍາວນານ, ບ່ອນທີ່ຄໍານາມຫຼາຍຄໍາຖືກເຂົ້າຮ່ວມເພື່ອກາຍເປັນຄໍາໃໝ່ຄໍາໜຶ່ງ.
ຕົວຢ່າງ, ‘credit card security’ ກາຍເປັນ ‘creditcardbeveiliging’.
ເຄື່ອງຈັກການແປຕ້ອງສາມາດກໍານົດໄດ້ຢ່າງຖືກຕ້ອງວ່າຈະຄວນລວມຄໍາສັບຕ່າງໆເມື່ອໃດ, ເນື່ອງຈາກການແຍກຫຼືການເວັ້ນຊ່ອງຫວ່າງທີ່ບໍ່ຖືກຕ້ອງສາມາດປ່ຽນຄວາມໝາຍຫຼືສຽງບໍ່ເປັນທໍາມະຊາດ.ນອກຈາກນັ້ນ, ຄໍານາມພາສາດັດຊ໌ມີເພດທາງໄວຍະກອນ (de/het), ເຊິ່ງສົ່ງຜົນກະທົບຕໍ່ຄໍານໍາໜ້າ ແລະ ຄໍາຄຸນນາມທີ່ໃຊ້ກັບພວກມັນ.
ໃນຂະນະທີ່ນີ້ແມ່ນກົດລະບຽບທາງໄວຍະກອນທີ່ຊັບຊ້ອນ, ຮູບແບບການແປທີ່ມີຄວາມສາມາດເຊັ່ນ: ອັນທີ່ຂັບເຄື່ອນ Doctranslate ສາມາດຈັດການການມອບໝາຍເຫຼົ່ານີ້ໄດ້ຢ່າງຖືກຕ້ອງ.
API ຂອງພວກເຮົາຮັບປະກັນວ່າຂໍ້ຄວາມສຸດທ້າຍບໍ່ພຽງແຕ່ຖືກຕ້ອງໃນຄວາມໝາຍເທົ່ານັ້ນ ແຕ່ຍັງຖືກຕ້ອງຕາມຫຼັກໄວຍາກອນ ແລະ ລຽບງ່າຍ.ການນໍາໃຊ້ຄໍາສັບສະເພາະດ້ານ (Domain-Specific Glossaries)
ສຳລັບຂົງເຂດດ້ານເທັກນິກສູງ ເຊັ່ນ: ກົດໝາຍ, ການແພດ, ຫຼື ວິສະວະກຳ, ຄຳສັບສະເພາະຕ້ອງຖືກແປຢ່າງສອດຄ່ອງ.
ການແປຈຸດປະສົງທົ່ວໄປອາດຈະບໍ່ສາມາດຈັບຄວາມໝາຍທີ່ແນ່ນອນຂອງຄຳສັບພາຍໃນຂົງເຂດສະເພາະໃດໜຶ່ງໄດ້.
ນີ້ສາມາດນໍາໄປສູ່ຄວາມຄຸມເຄືອ ຫຼື, ໃນຄໍາຮ້ອງສະຫມັກທີ່ສໍາຄັນ, ຄວາມບໍ່ຖືກຕ້ອງທີ່ອັນຕະລາຍໃນເອກະສານສຸດທ້າຍ.Doctranslate ສະຫນອງຄຸນສົມບັດຕ່າງໆເຊັ່ນ: ການປັບຕົວໂດເມນ ແລະ ການຮອງຮັບຄໍາສັບເພື່ອແກ້ໄຂບັນຫານີ້.
ໂດຍການລະບຸ `domain` (ເຊັ່ນ, ‘medical’, ‘legal’) ຫຼື ການສະຫນອງຄໍາສັບແບບກໍານົດເອງ, ທ່ານສາມາດຮັບປະກັນວ່າຄໍາສັບຫຼັກຖືກແປຕາມຄວາມຕ້ອງການສະເພາະຂອງທ່ານສະເໝີ.
ລະດັບການຄວບຄຸມນີ້ແມ່ນຈໍາເປັນຢ່າງຍິ່ງສໍາລັບອົງການຈັດຕັ້ງທີ່ຕ້ອງການການແປທີ່ຖືກຕ້ອງຕາມການຮັບຮອງສໍາລັບເອກະສານດ້ານເທັກນິກ, ສັນຍາ, ແລະ ບົດລາຍງານຂອງພວກເຂົາ.ສະຫຼຸບ ແລະ ຂັ້ນຕອນຕໍ່ໄປ
ການເຊື່ອມໂຍງ PDF Translation API ທີ່ມີປະສິດທິພາບສໍາລັບການປ່ຽນແປງຈາກ ພາສາອັງກິດ ເປັນ ພາສາດັດຊ໌ ສາມາດເລັ່ງຂະບວນການເຮັດວຽກສາກົນຂອງທ່ານໄດ້ຢ່າງຫຼວງຫຼາຍ.
Doctranslate API ສະໜອງໂຊລູຊັ່ນທີ່ສົມບູນແບບທີ່ຈັດການກັບຄວາມຊັບຊ້ອນທາງດ້ານເຕັກນິກອັນໃຫຍ່ຫຼວງຂອງການຈັດການ PDF ແລະ ສະໜອງການແປທີ່ລະອຽດອ່ອນທາງດ້ານພາສາ.
ດ້ວຍສະຖາປັດຕະຍະກໍາ RESTful, ການຮັກສາຮູບແບບທີ່ເຂັ້ມແຂງ, ແລະ ຄຸນສົມບັດສໍາລັບການຈັດການລາຍລະອຽດສະເພາະຂອງພາສາ, ມັນເຮັດໃຫ້ຜູ້ພັດທະນາສາມາດສ້າງແອັບພລິເຄຊັນທົ່ວໂລກທີ່ມີຄວາມຊັບຊ້ອນໄດ້.ໂດຍການປະຕິບັດຕາມຄູ່ມືການເຊື່ອມໂຍງທີ່ສະໜອງໃຫ້, ທ່ານສາມາດເພີ່ມຄວາມສາມາດໃນການແປເອກະສານທີ່ມີຄຸນນະພາບສູງເຂົ້າໃນບໍລິການຂອງທ່ານໄດ້ຢ່າງວ່ອງໄວ.
ພວກເຮົາຊຸກຍູ້ໃຫ້ທ່ານສຳຫຼວດເອກະສານ Doctranslate API ຢ່າງເປັນທາງການ ເພື່ອຄົ້ນພົບຄຸນສົມບັດຂັ້ນສູງເພີ່ມເຕີມ, ເຊັ່ນ: ການສ້າງເອກະສານສອງພາສາ ແລະ ຄູ່ພາສາເພີ່ມເຕີມ.
ເລີ່ມຕົ້ນການສ້າງໃນມື້ນີ້ເພື່ອເຊື່ອມຕໍ່ສິ່ງກີດຂວາງທາງດ້ານພາສາ ແລະ ນໍາສົ່ງເນື້ອຫາຂອງທ່ານໄປສູ່ຜູ້ຊົມທົ່ວໂລກດ້ວຍຄວາມຫມັ້ນໃຈແລະຄວາມແມ່ນຍໍາ.

Tinggalkan Komen