ສິ່ງທ້າທາຍພາຍໃນຂອງການແປ PDF ແບບໂປຣແກຣມ
ນັກພັດທະນາມັກຈະຕ້ອງການ API ທີ່ເຂັ້ມແຂງເພື່ອແປ PDF ຈາກພາສາອັງກິດເປັນພາສາດັດ, ແຕ່ໄດ້ຄົ້ນພົບຄວາມສັບສົນພື້ນຖານຂອງວຽກງານຢ່າງວ່ອງໄວ.
ຕ່າງຈາກຮູບແບບຂໍ້ຄວາມທີ່ງ່າຍດາຍ, PDF ບໍ່ແມ່ນເອກະສານເສັ້ນຊື່; ມັນເປັນບັນຈຸທີ່ສັບສົນສໍາລັບວັດຖຸຕ່າງໆເຊັ່ນ: ບລັອກຂໍ້ຄວາມ, ຮູບພາບ vector, ຮູບພາບ raster, ແລະ metadata.
ໂຄງສ້າງນີ້ຖືກອອກແບບມາສໍາລັບການສະແດງພາບທີ່ຊັດເຈນໃນທົ່ວແພລດຟອມຕ່າງໆ, ບໍ່ແມ່ນສໍາລັບການສະກັດແລະການດັດແປງເນື້ອຫາໂດຍກົງ.
ການພະຍາຍາມແຍກ PDF ແບບໂປຣແກຣມມັກຈະນໍາໄປສູ່ບັນຫາທີ່ສໍາຄັນທີ່ສາມາດເຮັດໃຫ້ຜົນໄດ້ຮັບສຸດທ້າຍເສຍຫາຍໄດ້.
ເຄື່ອງມືສະກັດຂໍ້ຄວາມແບບງ່າຍດາຍມັກຈະບໍ່ເຂົ້າໃຈລໍາດັບການອ່ານ, ແຍກປະໂຫຍກຕ່າງໆໃນທົ່ວ ກ່ອງຂໍ້ຄວາມທີ່ແຕກຕ່າງກັນ, ແລະບໍ່ສາມາດສ້າງຕາຕະລາງ ຫຼືຮູບແບບຫຼາຍຄໍລໍາຄືນໃໝ່ໄດ້.
ສິ່ງທ້າທາຍເຫຼົ່ານີ້ເຮັດໃຫ້ວິທີການແປ PDF ທີ່ງ່າຍດາຍບໍ່ສາມາດປະຕິບັດໄດ້ສໍາລັບຄໍາຮ້ອງສະຫມັກມືອາຊີບໃດໆທີ່ຄວາມຖືກຕ້ອງແລະຄວາມສົມບູນຂອງເອກະສານແມ່ນສໍາຄັນທີ່ສຸດ.
ການຖອດລະຫັດໂຄງສ້າງ PDF ທີ່ສັບສົນ
ຮູບແບບເອກະສານແບບພົກພາ (PDF) ແມ່ນຮູບແບບກຣາຟິກ vector ໂດຍພື້ນຖານ, ອະທິບາຍໜ້າຕ່າງໆເປັນການລວບລວມວັດຖຸທີ່ມີຈຸດປະສານງານສະເພາະ.
ຂໍ້ຄວາມມັກຈະຖືກແຍກອອກເປັນຊິ້ນສ່ວນຂະໜາດນ້ອຍ, ຖືກຈັດຕໍາແໜ່ງ, ຫມາຍຄວາມວ່າປະໂຫຍກດຽວສາມາດຖືກເກັບໄວ້ເປັນຫຼາຍສາຍທີ່ເປັນເອກະລາດ.
ດັ່ງນັ້ນ, API ທີ່ມີປະສິດທິພາບຕ້ອງປະກອບຊິ້ນສ່ວນເຫຼົ່ານີ້ຄືນໃໝ່ຢ່າງສະຫຼາດໃຫ້ເປັນການເລົ່າເລື່ອງທີ່ສອດຄ່ອງກັນກ່ອນການແປສາມາດເລີ່ມຕົ້ນໄດ້, ເຊິ່ງເປັນຂະບວນການທີ່ເຕັມໄປດ້ວຍຂໍ້ຜິດພາດທີ່ອາດຈະເກີດຂຶ້ນ.
ນອກຈາກນັ້ນ, PDF ສາມາດບັນຈຸຊັ້ນຕ່າງໆ, ພາກສ່ວນແບບຟອມໂຕ້ຕອບ, ແລະຕົວອັກສອນຝັງ, ເຊິ່ງແຕ່ລະອັນເພີ່ມຄວາມສັບສົນ.
ລະບົບການແປຕ້ອງຕັດສິນໃຈວິທີການຈັດການອົງປະກອບເຫຼົ່ານີ້, ບໍ່ວ່າຈະແປຂໍ້ຄວາມພາຍໃນຮູບພາບ (ໂດຍໃຊ້ OCR), ຫຼືວິທີການຈັດການການເຂົ້າລະຫັດຕົວອັກສອນທີ່ບໍ່ແມ່ນມາດຕະຖານ.
ຫາກບໍ່ມີເຄື່ອງຈັກການແຍກທີ່ຊັບຊ້ອນ, ອົງປະກອບເຫຼົ່ານີ້ມັກຈະສູນເສຍ ຫຼືສະແດງຜົນບໍ່ຖືກຕ້ອງໃນເອກະສານທີ່ແປແລ້ວ, ເຮັດໃຫ້ໄດ້ຜົນທີ່ບໍ່ສາມາດໃຊ້ໄດ້.
ຝັນຮ້າຍຂອງການຮັກສາຮູບແບບ
ບາງທີສິ່ງທ້າທາຍທີ່ຍິ່ງໃຫຍ່ທີ່ສຸດໃນການແປ PDF ແມ່ນການຮັກສາຮູບແບບພາບເດີມ.
ເອກະສານມັກຈະອີງໃສ່ການຈັດລຽງທີ່ຊັດເຈນຂອງຂໍ້ຄວາມ, ຮູບພາບ, ແລະຕາຕະລາງເພື່ອຖ່າຍທອດຂໍ້ມູນຢ່າງມີປະສິດທິພາບ, ເຊັ່ນໃນໃບແຈ້ງໜີ້, ສັນຍາທາງກົດໝາຍ, ຫຼືຄູ່ມືດ້ານວິຊາການ.
ເມື່ອຂໍ້ຄວາມຖືກແປຈາກພາສາອັງກິດເປັນພາສາດັດ, ຄວາມຍາວຂອງປະໂຫຍກປ່ຽນແປງຢ່າງຫຼີກລ່ຽງບໍ່ໄດ້, ເຊິ່ງສາມາດເຮັດໃຫ້ຂໍ້ຄວາມລົ້ນອອກຈາກບັນຈຸທີ່ກໍານົດໄວ້.
ການຂະຫຍາຍ ຫຼື ການຫົດຕົວຂອງຂໍ້ຄວາມນີ້ ຮຽກຮ້ອງໃຫ້ຮູບແບບເອກະສານທັງໝົດຖືກປັບປ່ຽນໃໝ່ແບບໄດນາມິກ.
ອັນນີ້ລວມມີການປັບຂະໜາດກ່ອງຂໍ້ຄວາມ, ການປັບຄວາມກວ້າງຂອງຄໍລໍາ, ການຈັດໜ້າເອກະສານທັງໝົດຄືນໃໝ່, ແລະການຮັບປະກັນວ່າຮູບພາບແລະຕາຕະລາງຍັງຄົງສອດຄ່ອງກັບຂໍ້ຄວາມທີ່ສອດຄ້ອງກັນຢ່າງຖືກຕ້ອງ.
ການຂຽນລະຫັດດ້ວຍຕົນເອງສໍາລັບການປ່ຽນແປງຮູບແບບເຫຼົ່ານີ້ແມ່ນຍາກຫຼາຍ, ຊຶ່ງເປັນເຫດຜົນທີ່ວ່າ API ການແປທີ່ລະອຽດສູງ ທີ່ມີຄວາມຊ່ຽວຊານແມ່ນຈໍາເປັນ.
ການເຂົ້າລະຫັດຕົວອັກສອນ ແລະ ການສ້າງແຜນທີ່ຕົວອັກສອນ
ຕົວອັກສອນພາຍໃນ PDF ສາມາດຖືກຝັງໄວ້ຢ່າງຄົບຖ້ວນ, ເປັນຊຸດຍ່ອຍ, ຫຼືຖືກອ້າງອີງຈາກລະບົບເຈົ້າພາບ, ສ້າງຄວາມສັບສົນຂອງບັນຫາການເຂົ້າລະຫັດຕົວອັກສອນ.
ຖ້າການແປນໍາສະເໜີຕົວອັກສອນທີ່ບໍ່ມີຢູ່ໃນຊຸດ glyph ຂອງຕົວອັກສອນຕົ້ນສະບັບ, ພວກມັນຈະປາກົດເປັນຂໍ້ຄວາມທີ່ສັບສົນ ຫຼືກ່ອງເປົ່າໃນໄຟລ໌ຜົນໄດ້ຮັບ.
ດັ່ງນັ້ນ, API ການແປທີ່ເຂັ້ມແຂງຕ້ອງຈັດການການປ່ຽນແທນຕົວອັກສອນຢ່າງສະຫຼາດ, ຊອກຫາຕົວອັກສອນທີ່ຄ້າຍຄືກັນທາງສາຍຕາທີ່ຮອງຮັບຊຸດຕົວອັກສອນເຕັມຂອງພາສາເປົ້າໝາຍ, ໃນກໍລະນີນີ້, ພາສາດັດ.
ຂະບວນການນີ້ຍັງກ່ຽວຂ້ອງກັບການສ້າງແຜນທີ່ຕົວອັກສອນຢ່າງຖືກຕ້ອງຈາກການເຂົ້າລະຫັດແຫຼ່ງໄປຫາເປົ້າໝາຍ.
ບັນຫາກັບ Unicode, ການເຂົ້າລະຫັດແບບເກົ່າ, ແລະຊຸດຕົວອັກສອນທີ່ກຳນົດເອງສາມາດທຳລາຍຂໍ້ຄວາມທີ່ແປໄດ້ຢ່າງງ່າຍດາຍຖ້າບໍ່ໄດ້ຈັດການດ້ວຍຄວາມຊັດເຈນ.
ອຸປະສັກດ້ານວິຊາການເຫຼົ່ານີ້ເນັ້ນໜັກວ່າເປັນຫຍັງຍຸດທະສາດການປ່ຽນແທນຂໍ້ຄວາມຕໍ່ຂໍ້ຄວາມແບບງ່າຍໆຈຶ່ງຖືກກຳນົດໃຫ້ລົ້ມເຫຼວເມື່ອແປເອກະສານ PDF ທີ່ສັບສົນ.
ການນໍາສະເໜີ Doctranslate API: ວິທີແກ້ໄຂທີ່ເນັ້ນນັກພັດທະນາເປັນອັນດັບທໍາອິດ
Doctranslate API ຖືກອອກແບບມາສະເພາະເພື່ອເອົາຊະນະສິ່ງທ້າທາຍອັນໃຫຍ່ຫຼວງຂອງການແປເອກະສານ.
ມັນສະຫນອງ REST API ທີ່ງ່າຍດາຍແຕ່ມີພະລັງທີ່ຊ່ວຍໃຫ້ນັກພັດທະນາສາມາດລວມເອົາການແປ PDF ທີ່ມີຄຸນນະພາບສູງຈາກພາສາອັງກິດເປັນພາສາດັດໂດຍກົງເຂົ້າໃນຄໍາຮ້ອງສະຫມັກຂອງພວກເຂົາດ້ວຍຄວາມພະຍາຍາມຫນ້ອຍທີ່ສຸດ.
ລະບົບຂອງພວກເຮົາຈັດການການແຍກທີ່ສັບສົນ, ການສ້າງເນື້ອຫາຄືນໃໝ່, ການແປ, ແລະການປັບຮູບແບບ, ມອບເອກະສານສຸດທ້າຍທີ່ຖືກແປຢ່າງຖືກຕ້ອງແລະສະອາດທາງສາຍຕາ.
ເຄື່ອງຈັກການແປທີ່ມີປະສິດທິພາບຂອງພວກເຮົາຮັບປະກັນວ່າທ່ານສາມາດ ຮັກສາຮູບແບບເດີມແລະຕາຕະລາງຂອງ PDF ຂອງທ່ານ, ໂດຍການຈັດການຄວາມສັບສົນໃຫ້ທ່ານ.
ມັນຖືກສ້າງຂຶ້ນບົນສະຖາປັດຕະຍະກຳ REST ແບບງ່າຍດາຍທີ່ຍອມຮັບໄຟລ໌ຂອງທ່ານ ແລະສົ່ງຄືນສະບັບທີ່ແປໄດ້ຢ່າງສົມບູນ, ໂດຍການຫຍໍ້ຂະບວນການປະມວນຜົນ back-end ທີ່ຍາກອອກໄປ.
ຂະບວນການທັງໝົດແມ່ນ asynchronous, ເຮັດໃຫ້ມັນເຫມາະສົມສໍາລັບການຈັດການເອກະສານຂະໜາດໃຫຍ່ຫຼືສັບສົນໂດຍບໍ່ມີການບລັອກ main thread ຂອງຄໍາຮ້ອງສະຫມັກຂອງທ່ານແລະຮັບປະກັນປະສົບການຜູ້ໃຊ້ທີ່ລຽບງ່າຍ.
ຄຸນສົມບັດຫຼັກສຳລັບນັກພັດທະນາ
Doctranslate API ຖືກສ້າງຂຶ້ນໂດຍມີຄວາມຕ້ອງການຂອງນັກພັດທະນາເປັນຫຼັກ, ສະຫນອງຄຸນສົມບັດທີ່ເຮັດໃຫ້ການລວມເຂົ້າກັນງ່າຍຂຶ້ນແລະຮັບປະກັນຄວາມຫນ້າເຊື່ອຖື.
ຈຸດສຸມນີ້ຊ່ວຍໃຫ້ທ່ານໃຊ້ເວລາໜ້ອຍລົງໃນການກັງວົນກ່ຽວກັບຮູບແບບໄຟລ໌ ແລະໃຊ້ເວລາຫຼາຍຂຶ້ນໃນການສ້າງຟັງຊັນຫຼັກຂອງແອັບພລິເຄຊັນຂອງທ່ານ.
ນີ້ແມ່ນບາງຂໍ້ໄດ້ປຽບຫຼັກທີ່ທ່ານສາມາດນໍາໃຊ້ໄດ້ໃນເວລາແປ PDF ຈາກພາສາອັງກິດເປັນພາສາດັດ:
- RESTful Endpoints: ການອອກແບບ API ທີ່ສະອາດ, ຄາດເດົາໄດ້ທີ່ໃຊ້ວິທີການ HTTP ມາດຕະຖານ, ເຮັດໃຫ້ມັນງ່າຍຕໍ່ການລວມເຂົ້າກັບພາສາການຂຽນໂປຣແກຣມ ຫຼືແພລດຟອມໃດກໍ່ຕາມ.
- Secure Authentication: ຄໍາຮ້ອງຂໍທັງໝົດແມ່ນໄດ້ຮັບການປົກປ້ອງໂດຍໃຊ້ວິທີການກວດສອບຄວາມຖືກຕ້ອງຂອງ bearer token ແບບງ່າຍດາຍດ້ວຍລະຫັດ API ສ່ວນຕົວຂອງທ່ານ.
- Asynchronous Workflow: ສົ່ງເອກະສານ ແລະໄດ້ຮັບ ID ທີ່ເປັນເອກະລັກ; ຈາກນັ້ນທ່ານສາມາດສອບຖາມຫາສະຖານະການແປ, ອະນຸຍາດໃຫ້ມີການປະຕິບັດທີ່ບໍ່ບລັອກ, ປັບຂະໜາດໄດ້.
- Comprehensive Language Support: ການສະໜັບສະໜູນຢ່າງກວ້າງຂວາງສຳລັບຄູ່ພາສາຈຳນວນຫຼວງຫຼາຍ, ລວມທັງແບບຈຳລອງທີ່ມີຄວາມຖືກຕ້ອງສູງສຳລັບການແປຈາກພາສາອັງກິດເປັນພາສາດັດ.
- High-Fidelity Layout Preservation: ອັລກໍຣິດຂັ້ນສູງຮັບປະກັນວ່າເອກະສານທີ່ແປແລ້ວຍັງຄົງຮັກສາການຈັດຮູບແບບ, ຕາຕະລາງ, ຖັນ, ແລະການຈັດວາງຮູບພາບຕົ້ນສະບັບ.
- Clear JSON Responses: ການຕອບສະໜອງຂອງ API ທັງໝົດແມ່ນຢູ່ໃນຮູບແບບ JSON ທີ່ສະອາດ, ງ່າຍຕໍ່ການແຍກ, ເຮັດໃຫ້ການຈັດການຂໍ້ຜິດພາດ ແລະການຕິດຕາມສະຖານະພາບງ່າຍຂຶ້ນ.
ການລວມ API: ແປ PDF ຈາກພາສາອັງກິດເປັນພາສາດັດ
ຄູ່ມືຂັ້ນຕອນຕໍ່ຂັ້ນຕອນນີ້ຈະນຳພາທ່ານຜ່ານຂະບວນການຂອງການແປເອກະສານ PDF ຈາກພາສາອັງກິດເປັນພາສາດັດແບບໂປຣແກຣມ.
ພວກເຮົາຈະໃຊ້ Python ກັບໄລບຣາລີ `requests` ທີ່ນິຍົມເພື່ອສາທິດການເຮັດວຽກ, ເຊິ່ງກ່ຽວຂ້ອງກັບການອັບໂຫຼດເອກະສານ, ການກວດສອບສະຖານະການແປ, ແລະການດາວໂຫຼດຜົນໄດ້ຮັບສຸດທ້າຍ.
ຫຼັກການດຽວກັນນີ້ສາມາດຖືກນໍາໃຊ້ໄດ້ງ່າຍກັບພາສາອື່ນໆເຊັ່ນ Node.js, Java, ຫຼື PHP ໂດຍໃຊ້ HTTP clients ຂອງພວກເຂົາ.
ຂັ້ນຕອນທີ 1: ເອົາລະຫັດ API ຂອງທ່ານ
ກ່ອນທີ່ທ່ານຈະສາມາດໂທຫາ API ໃດໆ, ທ່ານຈໍາເປັນຕ້ອງໄດ້ຮັບລະຫັດ API ທີ່ເປັນເອກະລັກຂອງທ່ານ.
ລະຫັດນີ້ກວດສອບຄວາມຖືກຕ້ອງຂອງຄໍາຮ້ອງຂໍຂອງທ່ານແລະເຊື່ອມຕໍ່ພວກມັນກັບບັນຊີຂອງທ່ານ.
ທ່ານສາມາດເອົາລະຫັດຂອງທ່ານໄດ້ໂດຍການລົງທະບຽນຢູ່ໃນເວັບໄຊທ໌ Doctranslate ແລະໄປທີ່ສ່ວນ API ຂອງ user dashboard ຂອງທ່ານ.
ເມື່ອທ່ານມີລະຫັດຂອງທ່ານ, ໃຫ້ແນ່ໃຈວ່າຈະເກັບຮັກສາມັນໄວ້ຢ່າງປອດໄພ, ຕົວຢ່າງເຊັ່ນ, ເປັນ environment variable ໃນຄໍາຮ້ອງສະຫມັກຂອງທ່ານ.
ຢ່າເປີດເຜີຍລະຫັດ API ຂອງທ່ານໃນ client-side code ຫຼື commit ມັນໄປຫາ repository ຄວບຄຸມເວີຊັນສາທາລະນະ.
ຄໍາຮ້ອງຂໍ API ຕໍ່ໄປທັງໝົດຈະຕ້ອງມີລະຫັດນີ້ຢູ່ໃນ header `Authorization` ເປັນ bearer token.
ຂັ້ນຕອນທີ 2: ເລີ່ມຕົ້ນການແປ (ຄໍາຮ້ອງຂໍ POST)
ຂະບວນການແປເລີ່ມຕົ້ນໂດຍການສົ່ງຄໍາຮ້ອງຂໍ `POST` ໄປຫາ endpoint `/v2/translate/document`.
ຄໍາຮ້ອງຂໍນີ້ຕ້ອງຖືກຈັດຮູບແບບເປັນ `multipart/form-data` ແລະລວມເອົາເອກະສານທີ່ທ່ານຕ້ອງການແປພ້ອມກັບພາລາມິເຕີທີ່ຈໍາເປັນ.
ຊ່ອງຂໍ້ມູນທີ່ຕ້ອງການແມ່ນ `file`, `source_language` (‘en’ ສໍາລັບພາສາອັງກິດ), ແລະ `target_language` (‘nl’ ສໍາລັບພາສາດັດ).
ເມື່ອຄໍາຮ້ອງຂໍສໍາເລັດຜົນ, API ຈະຕອບສະໜອງທັນທີດ້ວຍວັດຖຸ JSON ທີ່ມີ `id` ທີ່ເປັນເອກະລັກສໍາລັບວຽກງານການແປເອກະສານຂອງທ່ານ.
ID ນີ້ແມ່ນກະແຈສໍາຄັນໃນການຕິດຕາມຄວາມຄືບໜ້າ ແລະການດຶງໄຟລ໌ສຸດທ້າຍໃນພາຍຫຼັງ.
API ບໍ່ໄດ້ລໍຖ້າໃຫ້ການແປສຳເລັດເພື່ອສົ່ງຄຳຕອບນີ້, ເຊິ່ງເປັນພື້ນຖານຂອງການອອກແບບ asynchronous ຂອງມັນ.
ຂັ້ນຕອນທີ 3: ການປະຕິບັດການອັບໂຫຼດ ແລະການປະມວນຜົນໃນ Python
ຂ້າງລຸ່ມນີ້ແມ່ນສະຄຣິບ Python ທີ່ສົມບູນທີ່ສະແດງໃຫ້ເຫັນເຖິງການເຮັດວຽກທັງໝົດ: ການອັບໂຫຼດ PDF, ການສອບຖາມຫາສະຖານະ, ແລະການດາວໂຫຼດໄຟລ໌ທີ່ແປແລ້ວ.
ລະຫັດນີ້ສະຫນອງພື້ນຖານພາກປະຕິບັດທີ່ທ່ານສາມາດປັບຕົວແລະລວມເຂົ້າໃນໂຄງການຂອງທ່ານເອງ.
ໃຫ້ແນ່ໃຈວ່າທ່ານປ່ຽນແທນຄ່າ placeholder ສໍາລັບ `API_KEY` ແລະ `FILE_PATH` ດ້ວຍຂໍ້ມູນປະຈໍາຕົວຕົວຈິງຂອງທ່ານແລະເສັ້ນທາງໄປຫາ PDF ຕົ້ນສະບັບຂອງທ່ານ.
import requests import time import os # Replace with your actual API key and file path API_KEY = "YOUR_API_KEY_HERE" FILE_PATH = "path/to/your/document.pdf" API_URL = "https://developer.doctranslate.io" def translate_document(api_key, file_path): # Step 1: Upload the document for translation print(f"Uploading {os.path.basename(file_path)} for translation...") upload_endpoint = f"{API_URL}/v2/translate/document" with open(file_path, 'rb') as f: files = {'file': (os.path.basename(file_path), f, 'application/pdf')} data = { 'source_language': 'en', 'target_language': 'nl', 'tone': 'formal' # Optional: specify formality } headers = {'Authorization': f'Bearer {api_key}'} response = requests.post(upload_endpoint, headers=headers, data=data, files=files) if response.status_code != 200: print(f"Error during upload: {response.status_code} {response.text}") return None document_id = response.json().get('id') print(f"Document uploaded successfully. ID: {document_id}") return document_id def check_translation_status(api_key, doc_id): # Step 2: Poll for translation status status_endpoint = f"{API_URL}/v2/translate/document/{doc_id}" headers = {'Authorization': f'Bearer {api_key}'} while True: response = requests.get(status_endpoint, headers=headers) if response.status_code != 200: print(f"Error checking status: {response.status_code} {response.text}") return None status_data = response.json() status = status_data.get('status') progress = status_data.get('progress', 0) print(f"Translation status: {status} ({progress}%)") if status == 'done': print("Translation finished.") return status_data elif status == 'error': print(f"Translation failed: {status_data.get('error')}") return None time.sleep(5) # Wait 5 seconds before checking again def download_translated_document(api_key, doc_id): # Step 3: Download the translated file download_endpoint = f"{API_URL}/v2/translate/document/{doc_id}/result" headers = {'Authorization': f'Bearer {api_key}'} response = requests.get(download_endpoint, headers=headers, stream=True) if response.status_code == 200: translated_file_path = f"translated_nl_{os.path.basename(FILE_PATH)}" with open(translated_file_path, 'wb') as f: for chunk in response.iter_content(chunk_size=8192): f.write(chunk) print(f"Translated document saved to {translated_file_path}") else: print(f"Error downloading file: {response.status_code} {response.text}") if __name__ == "__main__": if API_KEY == "YOUR_API_KEY_HERE" or not os.path.exists(FILE_PATH): print("Please update 'API_KEY' and ensure 'FILE_PATH' is correct.") else: document_id = translate_document(API_KEY, FILE_PATH) if document_id: status_info = check_translation_status(API_KEY, document_id) if status_info and status_info.get('status') == 'done': download_translated_document(API_KEY, document_id)ຂັ້ນຕອນທີ 4: ການສອບຖາມຫາສະຖານະການແປ (ຄໍາຮ້ອງຂໍ GET)
ຫຼັງຈາກທີ່ທ່ານໄດ້ຮັບ ID ເອກະສານ, ທ່ານຕ້ອງກວດສອບສະຖານະການແປເປັນໄລຍະໂດຍການສ້າງຄໍາຮ້ອງຂໍ `GET` ໄປຫາ endpoint `/v2/translate/document/{id}`.
ອັນນີ້ອະນຸຍາດໃຫ້ຄໍາຮ້ອງສະຫມັກຂອງທ່ານຕິດຕາມຄວາມຄືບໜ້າຂອງວຽກງານໂດຍບໍ່ຕ້ອງຮັກສາການເຊື່ອມຕໍ່ຄົງທີ່.
ການຕອບສະໜອງຂອງ JSON ຈະມີຊ່ອງຂໍ້ມູນ `status`, ເຊິ່ງສາມາດເປັນ `queued`, `processing`, `done`, ຫຼື `error`.ໄລຍະການສອບຖາມປົກກະຕິແມ່ນຢູ່ລະຫວ່າງ 5 ຫາ 10 ວິນາທີ, ແຕ່ທ່ານສາມາດປັບມັນໄດ້ຕາມຂະໜາດທີ່ຄາດໄວ້ຂອງເອກະສານຂອງທ່ານ.
ການຕອບສະໜອງຍັງລວມມີຊ່ອງຂໍ້ມູນ `progress`, ເຊິ່ງສະແດງເຖິງເປີເຊັນສໍາເລັດແລະສາມາດຖືກນໍາໃຊ້ເພື່ອໃຫ້ຄໍາຕິຊົມກັບຜູ້ໃຊ້ສຸດທ້າຍ.
ສືບຕໍ່ສອບຖາມຈົນກ່ວາສະຖານະປ່ຽນເປັນ `done` ຫຼື `error`.ຂັ້ນຕອນທີ 5: ການດຶງເອົາເອກະສານສຸດທ້າຍ
ເມື່ອ endpoint ກວດສອບສະຖານະສົ່ງຄືນ `done`, PDF ທີ່ແປແລ້ວແມ່ນພ້ອມໃຫ້ດາວໂຫລດ.
ທ່ານສາມາດດຶງເອົາມັນໄດ້ໂດຍການສ້າງຄໍາຮ້ອງຂໍ `GET` ສຸດທ້າຍໄປຫາ endpoint `/v2/translate/document/{id}/result`.
endpoint ນີ້ຈະຖ່າຍທອດຂໍ້ມູນ binary ຂອງໄຟລ໌ PDF ທີ່ແປແລ້ວ.ລະຫັດຂອງທ່ານຄວນຈະຖືກກະກຽມເພື່ອຈັດການ binary stream ນີ້ແລະຂຽນມັນໃສ່ໄຟລ໌ໃໝ່ໃນລະບົບທ້ອງຖິ່ນຂອງທ່ານ.
ດັ່ງທີ່ສະແດງຢູ່ໃນຕົວຢ່າງ Python, ອັນນີ້ກ່ຽວຂ້ອງກັບການເປີດໄຟລ໌ໃນໂຫມດ write-binary (`wb`) ແລະການເຮັດຊ້ຳໃນໄລຍະ content chunks ຂອງການຕອບສະໜອງ.
ໄຟລ໌ຜົນໄດ້ຮັບແມ່ນ PDF ພາສາອັງກິດຂອງທ່ານ, ທີ່ຖືກແປເປັນພາສາດັດຢ່າງຄົບຖ້ວນໃນຂະນະທີ່ຮັກສາການຈັດຮູບແບບຕົ້ນສະບັບຂອງມັນ.ການພິຈາລະນາທີ່ສຳຄັນສຳລັບການແປຈາກພາສາອັງກິດເປັນພາສາດັດ
ການແປຈາກພາສາອັງກິດເປັນພາສາດັດກ່ຽວຂ້ອງກັບຫຼາຍກວ່າພຽງແຕ່ການປ່ຽນຄໍາສັບ; ມັນຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈກ່ຽວກັບຄວາມແຕກຕ່າງທາງດ້ານພາສາແລະວັດທະນະທໍາ.
Doctranslate API ແມ່ນມີແບບຈໍາລອງທີ່ຖືກປັບປຸງຢ່າງລະອຽດສໍາລັບລາຍລະອຽດສະເພາະເຫຼົ່ານີ້, ຮັບປະກັນວ່າຜົນຜະລິດບໍ່ພຽງແຕ່ຖືກຕ້ອງເທົ່ານັ້ນ ແຕ່ຍັງເໝາະສົມກັບຜູ້ຊົມເປົ້າໝາຍ.
ການນໍາໃຊ້ພາລາມິເຕີທາງເລືອກໃນການໂທຫາ API ຂອງທ່ານສາມາດເພີ່ມຄຸນນະພາບຂອງການແປພາສາດັດຂອງທ່ານຕື່ມອີກ.ການຈັດການຄວາມເປັນທາງການ: ‘U’ ທຽບກັບ ‘Jij’
ພາສາດັດມີຄໍາສັບທີ່ແຕກຕ່າງກັນສໍາລັບບຸລຸດທີສອງທີ່ເປັນທາງການ (‘u’) ແລະບໍ່ເປັນທາງການ (‘jij’/’je’), ເຊິ່ງເປັນຄວາມແຕກຕ່າງທີ່ສໍາຄັນໃນການສື່ສານທາງທຸລະກິດ ແລະທາງການ.
ການແປສຽງທີ່ຜິດພາດສາມາດປາກົດວ່າບໍ່ເປັນມືອາຊີບຫຼືຄຸ້ນເຄີຍເກີນໄປ.
Doctranslate API ໄດ້ແກ້ໄຂບັນຫານີ້ໂດຍກົງດ້ວຍພາລາມິເຕີ `tone`, ເຊິ່ງສາມາດຖືກກໍານົດເປັນ `formal` ຫຼື `informal` ເພື່ອນໍາພາເຄື່ອງຈັກການແປໃນການເລືອກຄໍາສັບແລະຄໍານາມທີ່ຖືກຕ້ອງ.ສໍາລັບເອກະສານທຸລະກິດ, ກົດໝາຍ, ຫຼືດ້ານວິຊາການສ່ວນໃຫຍ່, ການຕັ້ງຄ່າ tone ເປັນ `formal` ແມ່ນແນະນໍາໃຫ້ສູງ.
ອັນນີ້ຮັບປະກັນວ່າການແປໃຊ້ລະດັບການເຄົາລົບແລະຄວາມເປັນມືອາຊີບທີ່ເຫມາະສົມທີ່ຄາດໄວ້ໃນວັດທະນະທໍາຂອງບໍລິສັດດັດ.
ພາລາມິເຕີທີ່ງ່າຍດາຍນີ້ສະຫນອງວິທີການທີ່ມີປະສິດທິພາບໃນການຄວບຄຸມສຽງຂອງເນື້ອຫາທີ່ແປແລ້ວຂອງທ່ານ.ການຈັດການຄໍານາມປະສົມຂອງພາສາດັດ
ພາສາດັດມັກຈະລວມເອົາຄໍານາມຫຼາຍອັນເຂົ້າກັນເປັນຄໍາປະສົມດຽວ, ຍາວ (ຕົວຢ່າງ, ‘aansprakelijkheidsverzekering’ ສໍາລັບ liability insurance).
ເຄື່ອງຈັກການແປແບບກົງໄປກົງມາ, ຕາມຕົວອັກສອນມັກຈະມີຄວາມຫຍຸ້ງຍາກກັບສິ່ງເຫຼົ່ານີ້, ບໍ່ວ່າຈະແຍກພວກມັນບໍ່ຖືກຕ້ອງ ຫຼືລົ້ມເຫລວໃນການແປພວກມັນທັງໝົດ.
ນີ້ແມ່ນຂໍ້ບົກພ່ອງທົ່ວໄປທີ່ນໍາໄປສູ່ການແປທີ່ງຸ່ມງ່າມແລະບໍ່ເປັນທໍາມະຊາດ.ແແບບຈໍາລອງການແປຂອງ Doctranslate ແມ່ນໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນຈໍານວນຫລາຍທີ່ປະກອບມີໂຄງສ້າງທາງດ້ານພາສາເຫຼົ່ານີ້.
ເຄື່ອງຈັກເຂົ້າໃຈບໍລິບົດແລະສ້າງຫຼືຕີຄວາມໝາຍຂອງຄຳນາມປະສົມຢ່າງຖືກຕ້ອງ, ສົ່ງຜົນໃຫ້ການແປທີ່ຄ່ອງແຄ້ວແລະເປັນທໍາມະຊາດ.
ນີ້ ການຮັບຮູ້ທາງດ້ານບໍລິບົດ ຮັບປະກັນວ່າຄໍາສັບທີ່ສັບສົນຖືກສະແດງຢ່າງຖືກຕ້ອງໂດຍບໍ່ມີການແກ້ໄຂດ້ວຍຕົນເອງຫຼັງຈາກການແປ.ການຮັບປະກັນຄວາມຖືກຕ້ອງດ້ານວິຊາການ ແລະ ສະເພາະໂດເມນ
ສໍາລັບເອກະສານທີ່ມີຄໍາສັບສະເພາະ, ເຊັ່ນ: ສັນຍາທາງກົດໝາຍ, ບົດລາຍງານທາງການແພດ, ຫຼືຂໍ້ກໍານົດດ້ານວິສະວະກໍາ, ການແປຈຸດປະສົງທົ່ວໄປອາດຈະບໍ່ພຽງພໍ.
Doctranslate API ສະຫນອງພາລາມິເຕີ `domain` ເພື່ອສະຫນອງບໍລິບົດເພີ່ມເຕີມໃຫ້ກັບເຄື່ອງຈັກການແປ.
ການກໍານົດໂດເມນເຊັ່ນ `legal` ຫຼື `medical` ຊ່ວຍໃຫ້ແບບຈໍາລອງເລືອກຄໍາສັບທີ່ເຫມາະສົມທີ່ສຸດຈາກຄໍາສັບສະເພາະຂອງມັນ.ໂດຍການນໍາໃຊ້ຄຸນສົມບັດນີ້, ທ່ານສາມາດເພີ່ມຄວາມຊັດເຈນຂອງການແປຂອງທ່ານສໍາລັບເອກະສານສະເພາະອຸດສາຫະກໍາໄດ້ຢ່າງຫຼວງຫຼາຍ.
ນີ້ຊ່ວຍຫຼຸດຜ່ອນຄວາມສ່ຽງຂອງຄວາມຄຸມເຄືອຫຼືຂໍ້ຜິດພາດທີ່ອາດຈະມີຜົນສະທ້ອນຮ້າຍແຮງໃນສະພາບການມືອາຊີບ.
ມັນຮັບປະກັນວ່າ PDF ພາສາດັດທີ່ແປແລ້ວຂອງທ່ານສື່ສານດ້ວຍລະດັບຄວາມຖືກຕ້ອງດຽວກັນກັບຕົ້ນສະບັບພາສາອັງກິດ.ສະຫຼຸບ: ປັບປຸງຂະບວນການແປ PDF ຂອງທ່ານ
ການລວມ API ເພື່ອແປ PDF ຈາກພາສາອັງກິດເປັນພາສາດັດ ສະໜອງວິທີແກ້ໄຂທີ່ສາມາດປັບຂະໜາດໄດ້, ມີປະສິດທິພາບ, ແລະສອດຄ່ອງກັນສໍາລັບການຈັດການເອກະສານຫຼາຍພາສາ.
Doctranslate API ໄດ້ກໍາຈັດອຸປະສັກທາງດ້ານວິຊາການຂອງການແຍກ PDF ແລະການຮັກສາຮູບແບບໄດ້ຢ່າງມີປະສິດທິພາບ, ເຮັດໃຫ້ນັກພັດທະນາສາມາດປະຕິບັດຫນ້າທີ່ນີ້ດ້ວຍພຽງແຕ່ສອງສາມແຖວຂອງລະຫັດ.
ນີ້ຊ່ວຍໃຫ້ທ່ານສາມາດສ້າງແອັບພລິເຄຊັນທົ່ວໂລກທີ່ມີປະສິດທິພາບຫຼາຍຂຶ້ນໂດຍບໍ່ຕ້ອງກາຍເປັນຜູ້ຊ່ຽວຊານໃນໂຄງສ້າງໄຟລ໌ເອກະສານ.ໂດຍການປະຕິບັດຕາມຂັ້ນຕອນທີ່ໄດ້ລະບຸໄວ້ໃນຄູ່ມືນີ້, ທ່ານສາມາດເຮັດໃຫ້ຂະບວນການແປທັງໝົດເປັນແບບອັດຕະໂນມັດ, ຈາກການອັບໂຫຼດໄຟລ໌ໄປຈົນເຖິງການດຶງເອົາສຸດທ້າຍ.
ລັກສະນະ asynchronous ຂອງ API ຮັບປະກັນວ່າຄໍາຮ້ອງສະຫມັກຂອງທ່ານຍັງຄົງຕອບສະໜອງ, ໃນຂະນະທີ່ຄຸນສົມບັດຂັ້ນສູງສໍາລັບການຄວບຄຸມ tone ແລະ domain ໃຫ້ຄວາມຖືກຕ້ອງທາງດ້ານພາສາທີ່ດີກວ່າ.
ສໍາລັບຂໍ້ມູນລະອຽດເພີ່ມເຕີມກ່ຽວກັບພາລາມິເຕີ ແລະ endpoints ທີ່ມີຢູ່ທັງໝົດ, ພວກເຮົາຂໍແນະນໍາໃຫ້ທ່ານຄົ້ນຫາເອກະສານ Doctranslate developer ຢ່າງເປັນທາງການ.

Để lại bình luận