ສິ່ງທ້າທາຍທີ່ຕິດພັນມາຂອງການແປ PDF ແບບ Programmatic
ການແປເອກະສານຈາກພາສາອັງກິດເປັນພາສາຝຣັ່ງແບບອັດຕະໂນມັດນຳສະເໜີອຸປະສັກທາງດ້ານເຕັກນິກທີ່ສຳຄັນ, ໂດຍສະເພາະເມື່ອຕ້ອງຈັດການກັບຮູບແບບ PDF.
ການລວມ API ທີ່ມີປະສິດທິພາບສູງສຳລັບການແປ PDF ຈາກພາສາອັງກິດເປັນພາສາຝຣັ່ງບໍ່ແມ່ນພຽງແຕ່ການແລກປ່ຽນຄຳສັບ; ມັນກ່ຽວຂ້ອງກັບສິ່ງທ້າທາຍທາງດ້ານໂຄງສ້າງ ແລະ ພາສາທີ່ເລິກເຊິ່ງ.
ນັກພັດທະນາຕ້ອງຮັບມືກັບການວິເຄາະໄຟລ໌ທີ່ຊັບຊ້ອນ, ການຮັກສາຮູບແບບ, ແລະ ກົດລະບຽບທາງພາສາທີ່ລະອຽດອ່ອນເພື່ອໃຫ້ໄດ້ຜົນລັບທີ່ເປັນມືອາຊີບ ແລະ ໃຊ້ງານໄດ້.
ການເຂົ້າໃຈຄວາມຫຍຸ້ງຍາກເຫຼົ່ານີ້ແມ່ນຂັ້ນຕອນທຳອິດໄປສູ່ການເຫັນຄຸນຄ່າຂອງພະລັງຂອງ API ການແປພາສາທີ່ຊ່ຽວຊານ.
ຖ້າບໍ່ມີເຄື່ອງມືທີ່ເໝາະສົມ, ນັກພັດທະນາອາດຈະໃຊ້ເວລາຫຼາຍຊົ່ວໂມງໃນການສ້າງເຄື່ອງມືວິເຄາະ ແລະ ເຄື່ອງມືຈັດຮູບແບບຂອງຕົນເອງ.
ຄູ່ມືນີ້ຈະສຳຫຼວດສິ່ງທ້າທາຍເຫຼົ່ານີ້ ແລະ ສະແດງໃຫ້ເຫັນວ່າ API ສະເພາະທາງສະໜອງວິທີແກ້ໄຂທີ່ສະຫງ່າງາມ ແລະ ມີປະສິດທິພາບສຳລັບໂຄງການຂອງທ່ານແນວໃດ.
ຄວາມຊັບຊ້ອນຂອງໂຄງສ້າງ PDF
ບໍ່ຄືກັບໄຟລ໌ຂໍ້ຄວາມທຳມະດາ ຫຼື HTML, PDF ບໍ່ແມ່ນເອກະສານແບບເສັ້ນຊື່ທີ່ງ່າຍດາຍ; ພວກມັນເປັນຮູບແບບ vector graphics ທີ່ຊັບຊ້ອນ.
ແຕ່ລະໜ້າແມ່ນຜืนຜ້າໃບທີ່ຂໍ້ຄວາມ, ຮູບພາບ, ແລະ ຕາຕະລາງຖືກວາງໄວ້ໃນຈຸດປະສານງານທີ່ແນ່ນອນ, ມັກຈະຢູ່ໃນບລັອກທີ່ບໍ່ຕໍ່ເນື່ອງກັນ.
ໂຄງສ້າງນີ້ເຮັດໃຫ້ການສະກັດເອົາກະແສຂໍ້ຄວາມທີ່ສອດຄ່ອງກັນເພື່ອການແປພາສາກາຍເປັນບັນຫາທາງວິສະວະກຳທີ່ສຳຄັນ ເຊິ່ງສາມາດທຳລາຍເຫດຜົນຂອງເອກະສານໄດ້ຢ່າງງ່າຍດາຍ.
ນອກຈາກນີ້, ເອກະສານ PDF ມັກຈະມີຊັ້ນ, metadata, ແລະ ຟອນທີ່ຝັງໄວ້ ເຊິ່ງຫ້ອງສະໝຸດການປະມວນຜົນຂໍ້ຄວາມມາດຕະຖານບໍ່ສາມາດຈັດການໄດ້.
ການສະກັດເອົາພຽງແຕ່ສາຍຂໍ້ຄວາມດິບຈະບໍ່ສົນໃຈຄວາມສຳພັນທາງດ້ານບໍລິບົດ ແລະ ການເບິ່ງເຫັນລະຫວ່າງອົງປະກອບ, ເຊິ່ງນຳໄປສູ່ການແປທີ່ສັບສົນ ແລະ ບໍ່ມີຄວາມໝາຍ.
ການແປພາສາທີ່ປະສົບຜົນສຳເລັດຮຽກຮ້ອງໃຫ້ມີເຄື່ອງມືທີ່ສາມາດແຍກສ່ວນ ແລະ ຫຼັງຈາກນັ້ນກໍ່ສ້າງໂຄງສ້າງທີ່ຊັບຊ້ອນນີ້ຄືນໃໝ່ຢ່າງສົມບູນ, ເຊິ່ງເປັນວຽກທີ່ບໍ່ແມ່ນເລື່ອງງ່າຍ.
ການຮັກສາຮູບແບບ ແລະ ການຈັດຮູບແບບທາງສາຍຕາ
ບາງທີສິ່ງທ້າທາຍທີ່ເຫັນໄດ້ຊັດເຈນທີ່ສຸດແມ່ນການຮັກສາຮູບແບບ ແລະ ການຈັດຮູບແບບຂອງເອກະສານຕົ້ນສະບັບຫຼັງຈາກການແປ.
ຂໍ້ຄວາມພາສາຝຣັ່ງມັກຈະຍາວກວ່າຄຳແປພາສາອັງກິດທີ່ທຽບເທົ່າ, ເຊິ່ງສາມາດເຮັດໃຫ້ຂໍ້ຄວາມລົ້ນຂອບເຂດເດີມຂອງມັນ, ເຮັດໃຫ້ຕາຕະລາງ, ຄໍລຳ, ແລະ ຮູບແບບໜ້າເສຍຫາຍ.
ການແກ້ໄຂບັນຫາການຈັດຮູບແບບເຫຼົ່ານີ້ດ້ວຍຕົນເອງຫຼັງຈາກການແປແມ່ນໃຊ້ເວລາຫຼາຍ ແລະ ທຳລາຍຈຸດປະສົງຂອງການເຮັດວຽກອັດຕະໂນມັດທັງໝົດ.
API ການແປ PDF ທີ່ມີປະສິດທິພາບຕ້ອງເຮັດຫຼາຍກວ່າການແປຂໍ້ຄວາມ; ມັນຕ້ອງຈັດລຽງເນື້ອຫາຄືນໃໝ່ຢ່າງສະຫຼາດ.
ນີ້ລວມເຖິງການປັບຂະໜາດກ່ອງຂໍ້ຄວາມ, ການປັບໄລຍະຫ່າງລະຫວ່າງແຖວ, ແລະ ຮັບປະກັນວ່າຮູບພາບ ແລະ ຕາຕະລາງຍັງຄົງຢູ່ໃນຕຳແໜ່ງທີ່ຖືກຕ້ອງທຽບກັບຂໍ້ຄວາມພາສາຝຣັ່ງໃໝ່.
ຂະບວນການນີ້, ເຊິ່ງເອີ້ນວ່າ Desktop Publishing (DTP) automation, ເປັນຄຸນສົມບັດຫຼັກຂອງບໍລິການແປພາສາຂັ້ນສູງເຊັ່ນ Doctranslate.
ການເຂົ້າລະຫັດຕົວອັກສອນ ແລະ ການຈັດການຟອນ
ການຈັດການການເຂົ້າລະຫັດຕົວອັກສອນແມ່ນອີກດ້ານໜຶ່ງທີ່ສຳຄັນ, ໂດຍສະເພາະສຳລັບພາສາເຊັ່ນພາສາຝຣັ່ງທີ່ໃຊ້ເຄື່ອງໝາຍກຳກັບສຽງ (ຕົວຢ່າງ, é, à, ç, û).
ຖ້າລະບົບບໍ່ຈັດການ UTF-8 ຫຼື ການເຂົ້າລະຫັດອື່ນໆທີ່ກ່ຽວຂ້ອງຢ່າງຖືກຕ້ອງ, ຕົວອັກສອນພິເສດເຫຼົ່ານີ້ອາດຈະເສຍຫາຍ, ເຮັດໃຫ້ເອກະສານບໍ່ເປັນມືອາຊີບ ແລະ ອ່ານບໍ່ໄດ້.
ເຄື່ອງມືການແປພາສາຕ້ອງຈັດການການແປງຕົວອັກສອນຈາກແຫຼ່ງຂໍ້ມູນໄປສູ່ເປົ້າໝາຍຢ່າງບໍ່ມີຂໍ້ຜິດພາດເພື່ອປ້ອງກັນການສູນເສຍຂໍ້ມູນໃດໆ.
ຍິ່ງໄປກວ່ານັ້ນ, ຟອນຕົ້ນສະບັບທີ່ຝັງຢູ່ໃນ PDF ພາສາອັງກິດອາດຈະບໍ່ມີຕົວອັກສອນທີ່ຈຳເປັນສຳລັບຕົວອັກສອນພາສາຝຣັ່ງ.
API ທີ່ຊັບຊ້ອນຕ້ອງຈັດການການທົດແທນຟອນຢ່າງສະຫງ່າງາມ, ໂດຍເລືອກຟອນທີ່ມີລັກສະນະຄ້າຍຄືກັນທາງສາຍຕາ ເຊິ່ງຮອງຮັບຊຸດຕົວອັກສອນພາສາຝຣັ່ງທັງໝົດ.
ນີ້ຮັບປະກັນວ່າເອກະສານທີ່ແປແລ້ວບໍ່ພຽງແຕ່ຖືກຕ້ອງໃນເນື້ອຫາເທົ່ານັ້ນ ແຕ່ຍັງມີຄວາມສອດຄ່ອງທາງດ້ານສາຍຕາ ແລະ ເປັນມືອາຊີບໃນການພິມຂອງມັນ.
The Doctranslate API: ວິທີແກ້ໄຂສຳລັບນັກພັດທະນາເປັນອັນດັບທຳອິດ
The Doctranslate API ຖືກອອກແບບມາໂດຍສະເພາະເພື່ອເອົາຊະນະສິ່ງທ້າທາຍທີ່ຊັບຊ້ອນເຫຼົ່ານີ້, ສະໜອງວິທີແກ້ໄຂທີ່ລຽບງ່າຍ ແລະ ເຊື່ອຖືໄດ້ສຳລັບນັກພັດທະນາ.
ມັນສະເໜີຊຸດເຄື່ອງມືທີ່ມີປະສິດທິພາບເພື່ອລວມການແປ PDF ຈາກພາສາອັງກິດເປັນພາສາຝຣັ່ງທີ່ມີຄຸນນະພາບສູງເຂົ້າໄປໃນແອັບພລິເຄຊັນ ແລະ ຂະບວນການເຮັດວຽກຂອງທ່ານໂດຍກົງ.
API ຂອງພວກເຮົາຊ່ວຍຫຼຸດຄວາມຊັບຊ້ອນຂອງການວິເຄາະ PDF, ການຈັດການຮູບແບບ, ແລະ ຄວາມລະອຽດອ່ອນທາງພາສາ, ຊ່ວຍໃຫ້ທ່ານສາມາດສຸມໃສ່ເຫດຜົນຫຼັກຂອງແອັບພລິເຄຊັນຂອງທ່ານໄດ້.
ສ້າງຂຶ້ນຕາມຫຼັກການ RESTful, API ຂອງພວກເຮົາງ່າຍຕໍ່ການລວມເຂົ້າກັນ ແລະ ໃຊ້ຮູບແບບ asynchronous ເພື່ອຈັດການເອກະສານຂະໜາດໃຫຍ່ ແລະ ຊັບຊ້ອນຢ່າງມີປະສິດທິພາບ.
ການອອກແບບນີ້ຮັບປະກັນວ່າແອັບພລິເຄຊັນຂອງທ່ານຍັງຄົງຕອບສະໜອງໄດ້ໃນຂະນະທີ່ລະບົບ backend ຂອງພວກເຮົາກຳລັງເຮັດວຽກໜັກໃນການແປ ແລະ ສ້າງຄືນໃໝ່.
ທ່ານຈະໄດ້ຮັບເອກະສານທີ່ແປຢ່າງເປັນມືອາຊີບ ເຊິ່ງພ້ອມນຳໃຊ້ໄດ້ທັນທີ, ໂດຍຮູບແບບຕົ້ນສະບັບຂອງມັນຖືກຮັກສາໄວ້ຢ່າງສົມບູນ. ເຕັກໂນໂລຊີຂອງພວກເຮົາໂດດເດັ່ນໃນສິ່ງທີ່ຮູ້ຈັກກັນໃນວົງການແປພາສາວ່າ ‘Giữ nguyên layout, bảng biểu’, ຊຶ່ງໝາຍຄວາມວ່າມັນຮັກສາຮູບແບບເດີມ ແລະ ຕາຕະລາງທັງໝົດໄວ້ຄືເກົ່າ. ທ່ານສາມາດ ທົດລອງເຄື່ອງແປ PDF ອອນໄລນ໌ຂອງພວກເຮົາ ເພື່ອເບິ່ງການຮັກສາຮູບແບບທີ່ມີປະສິດທິພາບນີ້ໃນການປະຕິບັດ.
ສ້າງຂຶ້ນຕາມຫຼັກການ RESTful
ການໂຕ້ຕອບກັບ Doctranslate API ແມ່ນງ່າຍດາຍ ແລະ ປະຕິບັດຕາມຫຼັກການມາດຕະຖານອຸດສາຫະກຳທີ່ນັກພັດທະນາຄຸ້ນເຄີຍຢູ່ແລ້ວ.
ມັນເຮັດວຽກຜ່ານ HTTPS ແລະ ຮັບເອົາວິທີການຮ້ອງຂໍມາດຕະຖານເຊັ່ນ POST ແລະ GET, ເຮັດໃຫ້ມັນເຂົ້າກັນໄດ້ກັບພາສາການຂຽນໂປຣແກຣມ ຫຼື ແພລດຟອມໃດກໍໄດ້.
ການຕອບກັບຖືກສົ່ງໃນຮູບແບບ JSON ທີ່ສະອາດ ແລະ ຄາດເດົາໄດ້, ເຮັດໃຫ້ຂະບວນການວິເຄາະຜົນລັບ ແລະ ການຈັດການສະຖານະຕ່າງໆໃນແອັບພລິເຄຊັນຂອງທ່ານງ່າຍຂຶ້ນ.
ຄວາມມຸ່ງໝັ້ນຕໍ່ຄວາມງ່າຍດາຍນີ້ໝາຍຄວາມວ່າທ່ານສາມາດເລີ່ມຕົ້ນ ແລະ ເຮັດວຽກໄດ້ໃນນາທີ, ບໍ່ແມ່ນມື້.
ການກວດສອບຄວາມຖືກຕ້ອງຖືກຈັດການຜ່ານ API key ທີ່ງ່າຍດາຍ, ແລະ endpoints ຕ່າງໆກໍຖືກບັນທຶກໄວ້ຢ່າງຊັດເຈນພ້ອມຕົວຢ່າງ.
ໂດຍການຍຶດໝັ້ນກັບຫຼັກການ REST, ພວກເຮົາຮັບປະກັນອຸປະສັກໃນການເລີ່ມຕົ້ນທີ່ຕ່ຳ ແລະ ປະສົບການການລວມເຂົ້າກັນທີ່ລຽບງ່າຍສຳລັບທີມພັດທະນາຂອງທ່ານ.
ຂະບວນການເຮັດວຽກແບບ Asynchronous ສຳລັບໄຟລ໌ຂະໜາດໃຫຍ່
ການແປ PDF ຂະໜາດໃຫຍ່ທີ່ມີຫຼາຍໜ້າແມ່ນວຽກທີ່ໃຊ້ຊັບພະຍາກອນຫຼາຍ ແລະ ອາດໃຊ້ເວລາເພື່ອໃຫ້ສຳເລັດ.
ເພື່ອປ້ອງກັນການຂັດຂວາງ thread ຫຼັກຂອງແອັບພລິເຄຊັນຂອງທ່ານ, Doctranslate API ໃຊ້ ຮູບແບບການປະມວນຜົນແບບ asynchronous.
ເມື່ອທ່ານສົ່ງເອກະສານ, API ຈະສົ່ງຄືນ ID ເອກະສານທີ່ບໍ່ຊ้ำກັນທັນທີ ແລະ ເລີ່ມການປະມວນຜົນການແປໃນເບື້ອງຫຼັງ.
ຫຼັງຈາກນັ້ນທ່ານສາມາດໃຊ້ ID ເອກະສານນີ້ເພື່ອສອບຖາມ endpoint ສະຖານະເປັນໄລຍະໆ ເພື່ອກວດສອບຄວາມຄືບໜ້າຂອງການແປ.
ເມື່ອຂະບວນການສຳເລັດ, endpoint ສະຖານະຈະໃຫ້ URL ທີ່ປອດໄພ ເຊິ່ງທ່ານສາມາດດາວໂຫຼດ PDF ພາສາຝຣັ່ງທີ່ແປແລ້ວຢ່າງສົມບູນໄດ້.
ຂະບວນການເຮັດວຽກນີ້ສາມາດຂະຫຍາຍໄດ້ສູງ ແລະ ມີຄວາມເຂັ້ມແຂງ, ເໝາະສຳລັບການຈັດການຄວາມຕ້ອງການແປເອກະສານຈຳນວນຫຼາຍ ຫຼື ຮູບແບບຂະໜາດໃຫຍ່ໂດຍບໍ່ສົ່ງຜົນກະທົບຕໍ່ປະສົບການຂອງຜູ້ໃຊ້.
ຄູ່ມືຂັ້ນຕອນຕໍ່ຂັ້ນຕອນໃນການລວມ API ການແປ PDF
ພາກນີ້ສະໜອງຄູ່ມືພາກປະຕິບັດ, ຂັ້ນຕອນຕໍ່ຂັ້ນຕອນສຳລັບການລວມ API ການແປ PDF ຈາກພາສາອັງກິດເປັນພາສາຝຣັ່ງຂອງພວກເຮົາເຂົ້າໄປໃນແອັບພລິເຄຊັນຂອງທ່ານໂດຍໃຊ້ Python.
ພວກເຮົາຈະກວມເອົາທຸກຢ່າງຕັ້ງແຕ່ການໄດ້ຮັບຂໍ້ມູນປະຈຳຕົວຂອງທ່ານໄປຈົນເຖິງການອັບໂຫຼດໄຟລ໌, ການກວດສອບສະຖານະ, ແລະ ການດາວໂຫຼດຜົນລັບສຸດທ້າຍ.
ການປະຕິບັດຕາມຂັ້ນຕອນເຫຼົ່ານີ້ຈະເຮັດໃຫ້ທ່ານມີການນຳໃຊ້ທີ່ເຮັດວຽກໄດ້ ເຊິ່ງທ່ານສາມາດປັບປ່ຽນໃຫ້ເຂົ້າກັບກໍລະນີການນຳໃຊ້ສະເພາະຂອງທ່ານໄດ້.
ເງື່ອນໄຂເບື້ອງຕົ້ນ: ການຂໍຮັບ API Key ຂອງທ່ານ
ກ່ອນທີ່ທ່ານຈະສາມາດໂທຫາ API ໃດໆ, ທ່ານຈຳເປັນຕ້ອງໄດ້ຮັບ API key ຈາກ dashboard ຂອງນັກພັດທະນາ Doctranslate ຂອງທ່ານ.
key ນີ້ເປັນຕົວລະບຸທີ່ບໍ່ຊ้ำກັນ ເຊິ່ງກວດສອບຄວາມຖືກຕ້ອງຂອງຄຳຮ້ອງຂໍຂອງທ່ານ ແລະ ຕ້ອງຖືກລວມຢູ່ໃນ headers ຂອງທຸກໆການໂທທີ່ທ່ານເຮັດ.
ເພື່ອເລີ່ມຕົ້ນ, ລົງທະບຽນສຳລັບບັນຊີນັກພັດທະນາໃນເວັບໄຊທ໌ຂອງພວກເຮົາ ແລະ ໄປທີ່ພາກ API ເພື່ອສ້າງ key ຂອງທ່ານ.
ທ່ານຍັງຈະຕ້ອງມີ Python ຕິດຕັ້ງຢູ່ໃນລະບົບຂອງທ່ານ, ພ້ອມກັບຫ້ອງສະໝຸດ `requests`, ເຊິ່ງຊ່ວຍໃຫ້ການຮ້ອງຂໍ HTTP ງ່າຍຂຶ້ນ.
ທ່ານສາມາດຕິດຕັ້ງມັນໄດ້ຢ່າງງ່າຍດາຍໂດຍໃຊ້ pip ຖ້າທ່ານຍັງບໍ່ມີມັນຢູ່ໃນເຄື່ອງຂອງທ່ານ.
ໃຊ້ຄຳສັ່ງ `pip install requests` ໃນ terminal ຂອງທ່ານເພື່ອຮັບປະກັນວ່າສະພາບແວດລ້ອມຂອງທ່ານພ້ອມແລ້ວສຳລັບ script ການລວມເຂົ້າກັນທີ່ພວກເຮົາຈະສ້າງຂຶ້ນ.
ຂັ້ນຕອນທີ 1: ການສົ່ງຄຳຮ້ອງຂໍການແປດ້ວຍ Python
ຂັ້ນຕອນທຳອິດໃນຂະບວນການແປແມ່ນການອັບໂຫຼດເອກະສານ PDF ແຫຼ່ງຂໍ້ມູນຂອງທ່ານໄປທີ່ endpoint `/v2/document/translate`.
ນີ້ແມ່ນຄຳຮ້ອງຂໍແບບ POST ທີ່ຕ້ອງການ API key ຂອງທ່ານເພື່ອການກວດສອບຄວາມຖືກຕ້ອງ ແລະ ພາຣາມິເຕີ form-data ຫຼາຍຢ່າງເພື່ອລະບຸລາຍລະອຽດການແປ.
ທ່ານຈະຕ້ອງໃຫ້ໄຟລ໌ເອງ, ລະຫັດພາສາແຫຼ່ງຂໍ້ມູນ (‘en’ ສຳລັບພາສາອັງກິດ), ແລະ ລະຫັດພາສາເປົ້າໝາຍ (‘fr’ ສຳລັບພາສາຝຣັ່ງ).
API ຈະປະມວນຜົນຄຳຮ້ອງຂໍນີ້ ແລະ, ຖ້າປະສົບຜົນສຳເລັດ, ຈະຕອບກັບທັນທີດ້ວຍ JSON object.
object ນີ້ຈະບັນຈຸ `document_id`, ເຊິ່ງເປັນຕົວລະບຸທີ່ບໍ່ຊ้ำກັນສຳລັບວຽກການແປຂອງທ່ານ.
ທ່ານຕ້ອງເກັບຮັກສາ ID ນີ້ໄວ້ຢ່າງລະມັດລະວັງ, ເພາະທ່ານຈະຕ້ອງການມັນໃນຂັ້ນຕອນຕໍ່ໄປເພື່ອກວດສອບສະຖານະການແປ ແລະ ເອົາເອກະສານສຸດທ້າຍ.
Script ການລວມເຂົ້າກັນຂອງ Python ແບບສົມບູນ
ຂ້າງລຸ່ມນີ້ແມ່ນ script Python ທີ່ສົມບູນເຊິ່ງສະແດງໃຫ້ເຫັນຂະບວນການເຮັດວຽກທັງໝົດສຳລັບການແປ PDF ຈາກພາສາອັງກິດເປັນພາສາຝຣັ່ງ.
script ນີ້ຈັດການການອັບໂຫຼດໄຟລ໌, ການສອບຖາມສະຖານະເປັນໄລຍະໆດ້ວຍຍຸດທະສາດການຖອຍຫຼັງທີ່ງ່າຍດາຍ, ແລະ ສຸດທ້າຍພິມ URL ດາວໂຫຼດສຳລັບໄຟລ໌ທີ່ແປແລ້ວ.
ຢ່າລືມປ່ຽນ `’YOUR_API_KEY’` ດ້ວຍ API key ຕົວຈິງຂອງທ່ານ ແລະ `’path/to/your/document.pdf’` ດ້ວຍເສັ້ນທາງໄຟລ໌ທີ່ຖືກຕ້ອງ.
import requests import time import os # API key ຂອງ Doctranslate ຂອງທ່ານ API_KEY = 'YOUR_API_KEY' # endpoints ຂອງ API TRANSLATE_URL = 'https://developer.doctranslate.io/v2/document/translate' STATUS_URL = 'https://developer.doctranslate.io/v2/document/status' # ການຕັ້ງຄ່າໄຟລ໌ ແລະ ພາສາ FILE_PATH = 'path/to/your/document.pdf' SOURCE_LANG = 'en' TARGET_LANG = 'fr' def translate_pdf(): """ສົ່ງ PDF ເພື່ອການແປ ແລະ ສົ່ງຄືນ ID ເອກະສານ.""" if not os.path.exists(FILE_PATH): print(f"ຂໍ້ຜິດພາດ: ບໍ່ພົບໄຟລ໌ທີ່ {FILE_PATH}") return None headers = { 'Authorization': f'Bearer {API_KEY}' } files = { 'file': (os.path.basename(FILE_PATH), open(FILE_PATH, 'rb'), 'application/pdf') } data = { 'source_language': SOURCE_LANG, 'target_language': TARGET_LANG } print("ກຳລັງອັບໂຫຼດເອກະສານເພື່ອການແປ...") try: response = requests.post(TRANSLATE_URL, headers=headers, files=files, data=data) response.raise_for_status() # ສ້າງ exception ສຳລັບ status code ທີ່ບໍ່ດີ (4xx ຫຼື 5xx) result = response.json() document_id = result.get('document_id') print(f"ເອກະສານຖືກສົ່ງສຳເລັດແລ້ວ. Document ID: {document_id}") return document_id except requests.exceptions.RequestException as e: print(f"ເກີດຂໍ້ຜິດພາດໃນລະຫວ່າງການອັບໂຫຼດ: {e}") return None def check_status_and_download(document_id): """ສອບຖາມສະຖານະຂອງການແປ ແລະ ພິມ URL ດາວໂຫຼດເມື່ອພ້ອມແລ້ວ.""" if not document_id: return headers = { 'Authorization': f'Bearer {API_KEY}' } status_endpoint = f"{STATUS_URL}/{document_id}" while True: print("ກຳລັງກວດສອບສະຖານະການແປ...") try: response = requests.get(status_endpoint, headers=headers) response.raise_for_status() result = response.json() status = result.get('status') print(f"ສະຖານະປັດຈຸບັນ: {status}") if status == 'done': download_url = result.get('translated_document_url') print(f" ການແປສຳເລັດແລ້ວ! ດາວໂຫຼດ PDF ພາສາຝຣັ່ງຂອງທ່ານທີ່ນີ້: {download_url}") break elif status == 'error': print(f"ເກີດຂໍ້ຜິດພາດໃນລະຫວ່າງການແປ: {result.get('message')}") break # ລໍຖ້າ 10 ວິນາທີກ່ອນທີ່ຈະສອບຖາມອີກຄັ້ງ time.sleep(10) except requests.exceptions.RequestException as e: print(f"ເກີດຂໍ້ຜິດພາດໃນຂະນະທີ່ກວດສອບສະຖານະ: {e}") break if __name__ == '__main__': doc_id = translate_pdf() check_status_and_download(doc_id)ຂັ້ນຕອນທີ 2: ການສອບຖາມສະຖານະ ແລະ ການເອົາຜົນລັບ
ຫຼັງຈາກທີ່ທ່ານສົ່ງເອກະສານ, ຂະບວນການແປຈະເລີ່ມຕົ້ນໃນເຊີບເວີຂອງພວກເຮົາ.
ດັ່ງທີ່ສະແດງໃນ script, ແອັບພລິເຄຊັນຂອງທ່ານຄວນເຮັດການຮ້ອງຂໍ GET ເປັນໄລຍະໆໄປທີ່ endpoint `/v2/document/status/{document_id}`.
endpoint ນີ້ຈະສົ່ງຄືນ JSON object ທີ່ບັນຈຸ `status` ປັດຈຸບັນຂອງວຽກ, ເຊິ່ງສາມາດເປັນ `queued`, `processing`, `done`, ຫຼື `error`.ໂຄດຂອງທ່ານຄວນນຳໃຊ້ loop ການສອບຖາມທີ່ສືບຕໍ່ກວດສອບ endpoint ນີ້ຈົນກວ່າສະຖານະຈະປ່ຽນເປັນ `done` ຫຼື `error`.
ເມື່ອສະຖານະເປັນ `done`, ການຕອບກັບ JSON ຈະລວມເອົາຊ່ອງຂໍ້ມູນ `translated_document_url`.
URL ນີ້ຊີ້ໄປທີ່ PDF ພາສາຝຣັ່ງທີ່ແປແລ້ວ, ເຊິ່ງທ່ານສາມາດດາວໂຫຼດ ແລະ ໃຊ້ໃນແອັບພລິເຄຊັນຂອງທ່ານ ຫຼື ສົ່ງໃຫ້ຜູ້ໃຊ້ຂອງທ່ານ.ຂໍ້ຄວນພິຈາລະນາທີ່ສຳຄັນສຳລັບການແປພາສາອັງກິດເປັນພາສາຝຣັ່ງ
ການແປຈາກພາສາອັງກິດເປັນພາສາຝຣັ່ງກ່ຽວຂ້ອງກັບຫຼາຍກວ່າການແປແບບຄຳຕໍ່ຄຳໂດຍກົງ.
ນັກພັດທະນາຄວນຮັບຮູ້ຄວາມລະອຽດອ່ອນທາງພາສາ ແລະ ເຕັກນິກສະເພາະເພື່ອຮັບປະກັນວ່າຜົນລັບສຸດທ້າຍບໍ່ພຽງແຕ່ຖືກຕ້ອງເທົ່ານັ້ນ ແຕ່ຍັງເໝາະສົມທາງດ້ານວັດທະນະທຳ ແລະ ຖືກຕ້ອງຕາມຫຼັກໄວຍາກອນ.
Doctranslate API ຖືກອອກແບບມາເພື່ອຈັດການຄວາມຊັບຊ້ອນເຫຼົ່ານີ້, ແຕ່ການເຂົ້າໃຈພວກມັນຊ່ວຍໃນການສ້າງຜະລິດຕະພັນສຸດທ້າຍທີ່ຂັດເກົາຍິ່ງຂຶ້ນ.ການຈັດການເຄື່ອງໝາຍກຳກັບສຽງຂອງພາສາຝຣັ່ງຢ່າງຖືກຕ້ອງ
ດັ່ງທີ່ໄດ້ກ່າວມາກ່ອນໜ້ານີ້, ພາສາຝຣັ່ງໃຊ້ເຄື່ອງໝາຍກຳກັບສຽງທີ່ຫຼາກຫຼາຍ ເຊິ່ງຈຳເປັນສຳລັບການສະກົດຄຳ ແລະ ການອອກສຽງທີ່ຖືກຕ້ອງ.
API ຂອງພວກເຮົາຖືກສ້າງຂຶ້ນດ້ວຍການຮອງຮັບ UTF-8 ຢ່າງເຕັມຮູບແບບຕັ້ງແຕ່ຕົ້ນຈົນຈົບ, ຮັບປະກັນວ່າທຸກໆສຳນຽງ (aigu, grave, circonflexe) ແລະ cedilla ຖືກຮັກສາໄວ້ຢ່າງສົມບູນ.
ນີ້ຊ່ວຍກຳຈັດຄວາມສ່ຽງຂອງການເສຍຫາຍຂອງຕົວອັກສອນ, ເຊິ່ງເປັນບັນຫາທົ່ວໄປກັບລະບົບການແປທີ່ບໍ່ເຂັ້ມແຂງ, ແລະ ຮັບປະກັນຜົນລັບທີ່ມີຄຸນນະພາບລະດັບມືອາຊີບ.ຄວາມໃສ່ໃຈໃນລາຍລະອຽດນີ້ຂະຫຍາຍໄປເຖິງຂັ້ນຕອນການສ້າງ PDF ຄືນໃໝ່.
API ຮັບປະກັນວ່າຟອນທີ່ໃຊ້ໃນເອກະສານສຸດທ້າຍຮອງຮັບຕົວອັກສອນພາສາຝຣັ່ງທີ່ຈຳເປັນທັງໝົດຢ່າງເຕັມທີ່.
ທ່ານສາມາດໝັ້ນໃຈໄດ້ວ່າຂໍ້ຄວາມທີ່ສະແດງຜົນຈະປາກົດຢ່າງຖືກຕ້ອງໃນທຸກໆໂປຣແກຣມເບິ່ງ PDF ແລະ ແພລດຟອມໂດຍບໍ່ມີຕົວອັກສອນທີ່ຂາດຫາຍໄປ ຫຼື ສະແດງຜົນບໍ່ຖືກຕ້ອງ.ການນຳໃຊ້ພາຣາມິເຕີສຽງ ແລະ ຄວາມເປັນທາງການ
ພາສາຝຣັ່ງມີລະດັບຄວາມເປັນທາງການທີ່ແຕກຕ່າງກັນ (ຕົວຢ່າງ, ຄວາມແຕກຕ່າງລະຫວ່າງ `tu` ແລະ `vous`) ເຊິ່ງບໍ່ມີຄຳທຽບເທົ່າໂດຍກົງໃນພາສາອັງກິດ.
Doctranslate API ໃຫ້ພາຣາມິເຕີທາງເລືອກ, ເຊັ່ນ `tone`, ເຊິ່ງທ່ານສາມາດໃຊ້ເພື່ອແນະນຳເຄື່ອງມືການແປໄປສູ່ແບບທີ່ເປັນທາງການ ຫຼື ບໍ່ເປັນທາງການຫຼາຍຂຶ້ນ.
ສຳລັບເອກະສານທຸລະກິດ, ຄູ່ມືດ້ານເຕັກນິກ, ຫຼື ສັນຍາທາງກົດໝາຍ, ການຕັ້ງຄ່າສຽງເປັນ `Serious` ຫຼື `Formal` ສາມາດຜະລິດການແປທີ່ເໝາະສົມ ແລະ ເຄົາລົບຫຼາຍຂຶ້ນ.ຄຸນສົມບັດນີ້ຊ່ວຍໃຫ້ທ່ານສາມາດປັບແຕ່ງຜົນລັບໃຫ້ເຂົ້າກັບຜູ້ຊົມ ແລະ ບໍລິບົດສະເພາະຂອງທ່ານ.
ໂດຍການໃຫ້ຄຳແນະນຳເຫຼົ່ານີ້ກັບແບບຈຳລອງການແປ, ທ່ານສາມາດປັບປຸງຄວາມລະອຽດອ່ອນ ແລະ ຄວາມເໝາະສົມທາງດ້ານວັດທະນະທຳຂອງຂໍ້ຄວາມສຸດທ້າຍໄດ້ຢ່າງຫຼວງຫຼາຍ.
ລະດັບການຄວບຄຸມນີ້ມີຄວາມສຳຄັນສຳລັບແອັບພລິເຄຊັນທີ່ຄຸນນະພາບ ແລະ ສຽງຂອງການສື່ສານເປັນສິ່ງສຳຄັນທີ່ສຸດ.ການຮັບປະກັນຄວາມສອດຄ່ອງ ແລະ ຄວາມລະອຽດອ່ອນທາງໄວຍາກອນ
ໄວຍາກອນພາສາຝຣັ່ງເປັນທີ່ຮູ້ຈັກກັນດີໃນເລື່ອງຄວາມຊັບຊ້ອນຂອງມັນ, ລວມທັງຄຳນາມທີ່ມີเพศ, ການຜັນຄຳກິລິຍາ, ແລະ ການຕົກລົງຂອງຄຳຄຸນນາມ.
ການແປດ້ວຍເຄື່ອງຈັກແບບງ່າຍດາຍອາດຈະບໍ່ສາມາດຈັບຄວາມສຳພັນທີ່ຊັບຊ້ອນເຫຼົ່ານີ້ໄດ້, ເຊິ່ງສົ່ງຜົນໃຫ້ປະໂຫຍກທີ່ບໍ່ສະດວກ ຫຼື ຜິດໄວຍາກອນ.
ເຄື່ອງມືການແປຂອງພວກເຮົາໃຊ້ແບບຈຳລອງເຄືອຂ່າຍປະສາດຂັ້ນສູງທີ່ຖືກຝຶກອົບຮົມເພື່ອເຂົ້າໃຈ ແລະ ຈຳລອງໂຄງສ້າງໄວຍາກອນທີ່ຊັບຊ້ອນເຫຼົ່ານີ້.
ນີ້ຮັບປະກັນວ່າຂໍ້ຄວາມທີ່ແປບໍ່ພຽງແຕ່ຖືກຕ້ອງເທົ່ານັ້ນ ແຕ່ຍັງໄຫຼລື່ນຢ່າງເປັນທຳມະຊາດ ແລະ ສອດຄ່ອງກັນ.API ຍັງມີຄວາມຊຳນານໃນການຈັດການສຳນວນ ແລະ ຄວາມລະອຽດອ່ອນທາງວັດທະນະທຳ.
ແທນທີ່ຈະໃຫ້ການແປຕາມຕົວອັກສອນທີ່ອາດຈະຟັງແປກໃນພາສາຝຣັ່ງ, ເຄື່ອງມືຈະລະບຸສຳນວນ ແລະ ແທນທີ່ພວກມັນດ້ວຍຄຳທຽບເທົ່າທາງວັດທະນະທຳທີ່ໃກ້ຄຽງທີ່ສຸດ.
ນີ້ສົ່ງຜົນໃຫ້ການແປທີ່ອ່ານຄືກັບວ່າຖືກຂຽນໂດຍເຈົ້າຂອງພາສາ, ຮັກສາຈຸດປະສົງ ແລະ ຜົນກະທົບເດີມຂອງຂໍ້ຄວາມແຫຼ່ງຂໍ້ມູນໄວ້.ສະຫຼຸບ: ເຮັດໃຫ້ຂະບວນການເຮັດວຽກການແປຂອງທ່ານລຽບງ່າຍຂຶ້ນ
ການລວມ Doctranslate API ເຂົ້າໄປໃນແອັບພລິເຄຊັນຂອງທ່ານສະໜອງວິທີແກ້ໄຂທີ່ມີປະສິດທິພາບ, ສາມາດຂະຫຍາຍໄດ້, ແລະ ມີປະສິດທິພາບສຳລັບການແປ PDF ຈາກພາສາອັງກິດເປັນພາສາຝຣັ່ງ.
ໂດຍການຈັດການຄວາມຊັບຊ້ອນຂອງການວິເຄາະ PDF, ການຮັກສາຮູບແບບ, ແລະ ຄວາມລະອຽດອ່ອນທາງພາສາ, API ຂອງພວກເຮົາຊ່ວຍປະຢັດເວລາ ແລະ ຊັບພະຍາກອນການພັດທະນາທີ່ມີຄ່າຂອງທ່ານ.
ທ່ານສາມາດເຮັດໃຫ້ຂະບວນການເຮັດວຽກເອກະສານຂອງທ່ານເປັນອັດຕະໂນມັດດ້ວຍຄວາມໝັ້ນໃຈ, ໂດຍຮູ້ວ່າຜົນລັບຈະຖືກຕ້ອງ ແລະ ຈັດຮູບແບບຢ່າງເປັນມືອາຊີບ.ຄູ່ມືນີ້ໄດ້ນຳພາທ່ານຜ່ານສິ່ງທ້າທາຍຂອງການແປ PDF ແລະ ໃຫ້ເສັ້ນທາງທີ່ຊັດເຈນ, ຂັ້ນຕອນຕໍ່ຂັ້ນຕອນໄປສູ່ການລວມເຂົ້າກັນທີ່ປະສົບຜົນສຳເລັດ.
ດ້ວຍ script Python ທີ່ໃຫ້ມາ ແລະ ຄວາມເຂົ້າໃຈກ່ຽວກັບຄຸນສົມບັດຂອງ API, ທ່ານມີຄວາມພ້ອມທີ່ຈະປັບປຸງແອັບພລິເຄຊັນຂອງທ່ານດ້ວຍຄວາມສາມາດໃນການແປທີ່ມີຄຸນນະພາບສູງ.
ສຳລັບຂໍ້ມູນລະອຽດເພີ່ມເຕີມກ່ຽວກັບພາຣາມິເຕີ ແລະ ຄຸນສົມບັດທັງໝົດທີ່ມີຢູ່, ພວກເຮົາຂໍແນະນຳໃຫ້ທ່ານສຳຫຼວດເອກະສານນັກພັດທະນາຢ່າງເປັນທາງການຂອງພວກເຮົາ.


Để lại bình luận