Doctranslate.io

API ການແປພາສາ PDF ຈາກ ອັງກິດ ເປັນ ອາຣັບ: ຮັກສາຮູບແບບ | ຄູ່ມື

Đăng bởi

vào

ສິ່ງທ້າທາຍສະເພາະຂອງການແປພາສາ PDF ດ້ວຍໂປຣແກຣມ

ການລວມເອົາ API ການແປພາສາ PDF ຈາກ ອັງກິດ ເປັນ ອາຣັບ ແມ່ນຄວາມຕ້ອງການທົ່ວໄປສໍາລັບແອັບພລິເຄຊັນທົ່ວໂລກ, ແຕ່ມັນມີອຸປະສັກທາງດ້ານເຕັກນິກທີ່ສໍາຄັນ.
ຕ່າງຈາກຮູບແບບຂໍ້ຄວາມທີ່ງ່າຍກວ່າ, PDF ແມ່ນພາຊະນະທີ່ສັບສົນທີ່ຖືກອອກແບບມາສໍາລັບການນໍາສະເຫນີ, ບໍ່ແມ່ນການຈັດການງ່າຍ.
ການເລືອກການອອກແບບພື້ນຖານນີ້ເຮັດໃຫ້ການແປພາສາດ້ວຍໂປຣແກຣມເປັນວຽກທີ່ບໍ່ແມ່ນເລື່ອງເລັກນ້ອຍທີ່ສາມາດເຮັດໃຫ້ຜູ້ພັດທະນາທີ່ມີປະສົບການຮູ້ສຶກອຸກອັ່ງໄດ້.

ການເຂົ້າໃຈສິ່ງທ້າທາຍເຫຼົ່ານີ້ແມ່ນບາດກ້າວທໍາອິດໄປສູ່ການເລືອກວິທີແກ້ໄຂທີ່ຖືກຕ້ອງ.
ວິທີການທີ່ບໍ່ຊໍານານຫຼາຍຢ່າງລົ້ມເຫຼວ ເພາະວ່າພວກເຂົາຖືວ່າ PDF ເປັນເອກະສານຂໍ້ຄວາມມາດຕະຖານ, ເຊິ່ງນໍາໄປສູ່ຮູບແບບທີ່ແຕກຫັກ ແລະ ຜົນໄດ້ຮັບທີ່ບໍ່ສາມາດອ່ານໄດ້.
ການເຮັດໃຫ້ຂະບວນການນີ້ເປັນແບບອັດຕະໂນມັດຢ່າງສຳເລັດຜົນ ຕ້ອງການ API ທີ່ເຂົ້າໃຈໂຄງສ້າງທີ່ສັບສົນຂອງຮູບແບບ PDF ເອງ.

ຄວາມສັບສົນຂອງໂຄງສ້າງໄຟລ໌ PDF

ໂດຍພື້ນຖານແລ້ວ, ຮູບແບບເອກະສານເຄື່ອນທີ່ (PDF) ບໍ່ແມ່ນໄຟລ໌ຂໍ້ຄວາມແບບຕາມລໍາດັບ ແຕ່ເປັນຮູບແບບກຣາຟິກ vector ທີ່ສັບສົນ.
ຂໍ້ຄວາມ, ຮູບພາບ, ແລະຮູບຮ່າງຖືກວາງໃສ່ໃນໜ້າໂດຍໃຊ້ພິກັດ X ແລະ Y ທີ່ຊັດເຈນ, ໂດຍບໍ່ມີຄວາມເຂົ້າໃຈພື້ນຖານຂອງວັກ, ຖັນ, ຫຼືການໄຫຼຂອງເຫດຜົນ.
ການສະກັດຂໍ້ຄວາມຕາມລໍາດັບການອ່ານທີ່ຖືກຕ້ອງມັກຈະເປັນອຸປະສັກສໍາຄັນທໍາອິດ, ເນື່ອງຈາກລໍາດັບພາຍໃນຂອງວັດຖຸຂໍ້ຄວາມອາດຈະບໍ່ກົງກັບລໍາດັບທາງສາຍຕາໃນໜ້າ.

ໂຄງສ້າງນີ້ຫມາຍຄວາມວ່າສະຄຣິບການສະກັດຂໍ້ຄວາມແບບງ່າຍໆອາດຈະດຶງຂໍ້ຄວາມ footer ຂອງໜ້າກ່ອນເນື້ອໃນຂອງເນື້ອໃນຫຼັກ.
ເຊັ່ນດຽວກັນ, ຂໍ້ຄວາມຈາກຖັນທີ່ຢູ່ຕິດກັນສາມາດຖືກສັບປົນກັນ, ສ້າງເປັນສາຍຂອງຄໍາສັບທີ່ບໍ່ມີຄວາມຫມາຍ.
ວິທີແກ້ໄຂການແປພາສາທີ່ຊັບຊ້ອນຕ້ອງປະຕິບັດການວິເຄາະເອກະສານທີ່ສັບສົນກ່ອນ ເພື່ອສ້າງລໍາດັບການອ່ານທີ່ຕັ້ງໃຈຄືນໃຫມ່ ກ່ອນທີ່ການແປພາສາໃດໆຈະສາມາດເລີ່ມຕົ້ນໄດ້.

ການຮັກສາຮູບແບບແລະການຈັດຮູບແບບທີ່ສັບສົນ

ສິ່ງທ້າທາຍທີ່ໃຫຍ່ທີ່ສຸດອັນດຽວໃນການແປພາສາ PDF ແມ່ນການຮັກສາຄວາມຖືກຕ້ອງທາງສາຍຕາຂອງເອກະສານຕົ້ນສະບັບ.
ນີ້ລວມມີການຮັກສາຮູບແບບຫຼາຍຖັນ, ຕາຕະລາງທີ່ມີຫົວຂໍ້ ແລະ ເຊລທີ່ຖືກລວມເຂົ້າກັນ, ຮູບພາບລອຍນໍ້າທີ່ມີຂໍ້ຄວາມຫຸ້ມຫໍ່, ແລະ ຫົວຂໍ້ ແລະ ທ້າຍເອກະສານທີ່ສອດຄ່ອງກັນ.
ເມື່ອຂໍ້ຄວາມພາສາອັງກິດຖືກແທນທີ່ດ້ວຍພາສາອາຣັບ, ຮູບແບບທັງໝົດຕ້ອງປັບຕົວ, ເຊິ່ງສັບສົນໂດຍການປ່ຽນແປງຄວາມຍາວຂອງຂໍ້ຄວາມ ແລະ ທິດທາງ.

ຕົວຢ່າງ, ຕາຕະລາງທີ່ແປຈາກພາສາອັງກິດເປັນພາສາອາຣັບ ຕ້ອງການບໍ່ພຽງແຕ່ການແປເນື້ອໃນຂອງເຊລເທົ່ານັ້ນ ແຕ່ຍັງຕ້ອງປີ້ນລໍາດັບຖັນ ເພື່ອໃຫ້ກົງກັບຮູບແບບການອ່ານຈາກຂວາຫາຊ້າຍ.
ການບໍ່ຈັດການຂະບວນການສ້າງຄືນໃຫມ່ນີ້ ສົ່ງຜົນໃຫ້ເອກະສານທີ່ຖືກແປທາງດ້ານເຕັກນິກ ແຕ່ບໍ່ສາມາດນໍາໃຊ້ໄດ້ຕົວຈິງ.
ນີ້ແມ່ນບ່ອນທີ່ API ການແປພາສາທົ່ວໄປສ່ວນໃຫຍ່ຂາດຕົກບົກຜ່ອງ, ເພາະວ່າພວກມັນບໍ່ໄດ້ຕິດຕັ້ງດ້ວຍເຄື່ອງຈັກການສ້າງຮູບແບບຄືນໃຫມ່ຂັ້ນສູງທີ່ຈໍາເປັນສໍາລັບຜົນໄດ້ຮັບທີ່ມີຄວາມຖືກຕ້ອງສູງ.

ບັນຫາສະເພາະກ່ຽວກັບຕົວອັກສອນ, ການເຂົ້າລະຫັດ, ແລະ ສະຄຣິບ

ເອກະສານ PDF ມັກຈະຝັງຊຸດຍ່ອຍຂອງຕົວອັກສອນ, ເຊິ່ງປະກອບດ້ວຍພຽງແຕ່ຕົວອັກສອນທີ່ໃຊ້ໃນເອກະສານຕົ້ນສະບັບເທົ່ານັ້ນ.
ເມື່ອແປເປັນພາສາໃໝ່ ເຊັ່ນ ພາສາອາຣັບ, ເຊິ່ງໃຊ້ສະຄຣິບທີ່ແຕກຕ່າງກັນຢ່າງສິ້ນເຊີງ, ຕົວອັກສອນທີ່ຝັງໄວ້ຕົ້ນສະບັບແມ່ນບໍ່ມີປະໂຫຍດ.
ລະບົບການແປພາສາຕ້ອງເລືອກ ແລະ ຝັງຕົວອັກສອນອາຣັບທີ່ເຫມາະສົມຢ່າງສະຫຼາດ ເຊິ່ງຮອງຮັບ glyphs, ligatures, ແລະ diacritics ທີ່ຈໍາເປັນທັງໝົດ ເພື່ອຮັບປະກັນວ່າຂໍ້ຄວາມຖືກສະແດງຢ່າງຖືກຕ້ອງ ແລະ ສາມາດອ່ານໄດ້.

ນອກຈາກນັ້ນ, ຄວາມບໍ່ກົງກັນຂອງການເຂົ້າລະຫັດຕົວອັກສອນສາມາດນໍາໄປສູ່ຂໍ້ຄວາມທີ່ຖືກບິດເບືອນ, ເຊິ່ງມັກຈະຖືກເອີ້ນວ່າ ‘mojibake,’ ບ່ອນທີ່ຕົວອັກສອນຖືກສະແດງບໍ່ຖືກຕ້ອງ.
API ທີ່ແຂງແຮງຕ້ອງຈັດການການປ່ຽນການເຂົ້າລະຫັດເຫຼົ່ານີ້ຢ່າງລຽບງ່າຍ, ຮັບປະກັນຄວາມສົມບູນຂອງຂໍ້ຄວາມຕົ້ນສະບັບ ແລະ ຄວາມຖືກຕ້ອງຂອງຜົນໄດ້ຮັບທີ່ແປ.
ສິ່ງທ້າທາຍກ່ຽວກັບຕົວອັກສອນ ແລະ ການເຂົ້າລະຫັດເຫຼົ່ານີ້ແມ່ນສໍາຄັນທີ່ຈະເອົາຊະນະໄດ້ສໍາລັບການຜະລິດເອກະສານທີ່ແປແລ້ວໃນລະດັບມືອາຊີບ.

ຂໍແນະນໍາ Doctranslate API: ວິທີແກ້ໄຂທີ່ເຂັ້ມແຂງ

ເພື່ອເອົາຊະນະອຸປະສັກທີ່ສໍາຄັນເຫຼົ່ານີ້, ຜູ້ພັດທະນາຕ້ອງການເຄື່ອງມືພິເສດ.
The Doctranslate API ສະໜອງວິທີແກ້ໄຂທີ່ຄົບຖ້ວນທີ່ຖືກອອກແບບມາສະເພາະສໍາລັບການແປເອກະສານທີ່ມີຄວາມຖືກຕ້ອງສູງ, ລວມທັງ API ການແປພາສາ PDF ທີ່ມີປະສິດທິພາບສໍາລັບພາສາອັງກິດເປັນພາສາອາຣັບ.
ມັນເປັນບໍລິການ RESTful ທີ່ສະຫຼຸບຄວາມສັບສົນຂອງການວິເຄາະໄຟລ໌, ການສ້າງຮູບແບບຄືນໃໝ່, ແລະ ການຈັດການຕົວອັກສອນ, ຊ່ວຍໃຫ້ທ່ານສາມາດສຸມໃສ່ເຫດຜົນຫຼັກຂອງແອັບພລິເຄຊັນຂອງທ່ານ.

ໂດຍການນໍາໃຊ້ advanced algorithms, API ຂອງພວກເຮົາໄດ້ແຍກ PDF ຕົ້ນສະບັບ, ແປເນື້ອໃນດ້ວຍຄວາມຖືກຕ້ອງສູງ, ແລະ ຈາກນັ້ນສ້າງ PDF ໃໝ່ໃນພາສາເປົ້າໝາຍຢ່າງລະມັດລະວັງ.
ຂະບວນການນີ້ຮັບປະກັນວ່າເອກະສານອາຣັບສຸດທ້າຍສະທ້ອນຮູບແບບ ແລະ ການຈັດຮູບແບບຂອງແຫຼ່ງພາສາອັງກິດເດີມ.
ຂະບວນການເຮັດວຽກທັງໝົດແມ່ນສາມາດເຂົ້າເຖິງໄດ້ຜ່ານການຮ້ອງຂໍ HTTP ທີ່ງ່າຍດາຍ, ມີເອກະສານດີ, ໂດຍມີການຕອບສະຫນອງທີ່ຖືກສົ່ງໃນຮູບແບບ JSON ທີ່ສາມາດຄາດເດົາໄດ້.

ຂໍ້ໄດ້ປຽບຫຼັກສໍາລັບຜູ້ພັດທະນາ

The Doctranslate API ຖືກສ້າງຂຶ້ນໂດຍຄໍານຶງເຖິງຜູ້ພັດທະນາ, ສະເໜີຂໍ້ໄດ້ປຽບຫຼັກຫຼາຍຢ່າງສໍາລັບການລວມເຂົ້າກັນຢ່າງບໍ່ຕິດຂັດ.
ຜົນປະໂຫຍດຕົ້ນຕໍແມ່ນ ເທັກໂນໂລຍີການຮັກສາຮູບແບບທີ່ບໍ່ມີໃຜທຽບເທົ່າ, ເຊິ່ງສ້າງຕາຕະລາງ, ຖັນ, ແລະ ອົງປະກອບທາງສາຍຕາຄືນໃໝ່ຢ່າງສະຫຼາດຫຼັງຈາກການແປພາສາ.
ທ່ານບໍ່ຈຳເປັນຕ້ອງກັງວົນອີກຕໍ່ໄປວ່າເອກະສານທີ່ຖືກແປຈະເປັນຄວາມສັບສົນຂອງຂໍ້ຄວາມ ແລະ ຮູບພາບ.

ຍິ່ງໄປກວ່ານັ້ນ, API ຖືກອອກແບບມາສໍາລັບ ການຂະຫຍາຍຕົວສູງ ແລະ ປະສິດທິພາບ, ສາມາດຈັດການເອກະສານຈໍານວນຫຼາຍແບບ asynchronously.
ນີ້ຫມາຍຄວາມວ່າທ່ານສາມາດສົ່ງຄໍາຮ້ອງຂໍການແປພາສາສໍາລັບ PDF ຂະຫນາດໃຫຍ່, ສັບສົນ ແລະ ໄດ້ຮັບ document ID ເພື່ອກວດສອບສະຖານະຕໍ່ມາໂດຍບໍ່ຕ້ອງປິດກັ້ນແອັບພລິເຄຊັນຂອງທ່ານ.
ສໍາລັບການສາທິດສົດຂອງວິທີການເທັກໂນໂລຍີຂອງພວກເຮົາສາມາດແປ PDF ຂອງທ່ານຈາກພາສາອັງກິດເປັນພາສາອາຣັບ ແລະ giữ nguyên layout, bảng biểu (keep layout and tables intact), ທ່ານສາມາດສໍາຫຼວດຄວາມສາມາດຂອງແພລດຟອມຂອງພວກເຮົາໄດ້.

ສຸດທ້າຍ, ຄວາມງ່າຍໃນການລວມເຂົ້າກັນ ຜ່ານການໂຕ້ຕອບ RESTful ມາດຕະຖານ ຫມາຍຄວາມວ່າທ່ານສາມາດເລີ່ມຕົ້ນໄດ້ຢ່າງວ່ອງໄວໂດຍໃຊ້ພາສາການຂຽນໂປຣແກຣມທີ່ທ່ານມັກ.
ດ້ວຍເອກະສານຄົບຖ້ວນ ແລະ ຈຸດສິ້ນສຸດຂອງ API ທີ່ຊັດເຈນ, ການສ້າງຄຸນສົມບັດການແປເອກະສານທີ່ມີປະສິດທິພາບເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານແມ່ນກົງໄປກົງມາ.
ການສຸມໃສ່ປະສົບການຂອງຜູ້ພັດທະນານີ້ຊ່ວຍຫຼຸດຜ່ອນຄວາມຫຍຸ້ງຍາກໃນການຮຽນຮູ້ ແລະ ເລັ່ງໄລຍະເວລາການພັດທະນາຂອງທ່ານ.

ຄູ່ມືເທື່ອລະຂັ້ນຕອນ: ການລວມເອົາ API ການແປພາສາ PDF ຈາກພາສາອັງກິດເປັນພາສາອາຣັບ

ຄູ່ມືນີ້ຈະນໍາພາທ່ານຜ່ານຂະບວນການແປເອກະສານ PDF ຈາກພາສາອັງກິດເປັນພາສາອາຣັບໂດຍໃຊ້ Doctranslate API ດ້ວຍ Python.
ພວກເຮົາຈະກວມເອົາການພິສູດຢືນຢັນ, ການອັບໂຫລດໄຟລ໌, ການກວດສອບສະຖານະ, ແລະ ການດາວໂຫລດໄຟລ໌ທີ່ຖືກແປສຸດທ້າຍ.
ການປະຕິບັດຕາມຂັ້ນຕອນເຫຼົ່ານີ້ຈະໃຫ້ສະຄຣິບທີ່ມີປະໂຫຍດແກ່ທ່ານເພື່ອແປໄຟລ໌ PDF ຂອງທ່ານດ້ວຍໂປຣແກຣມໃນຂະນະທີ່ຮັກສາການຈັດຮູບແບບຂອງພວກມັນໄວ້.

ຂໍ້ກໍານົດເບື້ອງຕົ້ນ

ກ່ອນທີ່ທ່ານຈະເລີ່ມຕົ້ນ, ໃຫ້ແນ່ໃຈວ່າທ່ານມີອົງປະກອບຕໍ່ໄປນີ້ພ້ອມສໍາລັບສະພາບແວດລ້ອມການພັດທະນາຂອງທ່ານ.
ທໍາອິດ, ທ່ານຈະຕ້ອງມີຄີ API ຂອງ Doctranslate, ເຊິ່ງທ່ານສາມາດໄດ້ຮັບໂດຍການລົງທະບຽນໃນແພລດຟອມຂອງພວກເຮົາ.
ອັນທີສອງ, ທ່ານຄວນມີ Python 3.6 ຫຼືໃໝ່ກວ່າຕິດຕັ້ງຢູ່ໃນລະບົບຂອງທ່ານ, ພ້ອມກັບ the popular `requests` library ສໍາລັບການຮ້ອງຂໍ HTTP.
ທ່ານສາມາດຕິດຕັ້ງ library ໄດ້ໂດຍການດໍາເນີນການຄໍາສັ່ງ `pip install requests` ໃນ terminal ຂອງທ່ານ.

ຂັ້ນຕອນທີ 1: ການພິສູດຢືນຢັນ ແລະ ການກະກຽມການຮ້ອງຂໍ

ການຮ້ອງຂໍທັງໝົດຕໍ່ Doctranslate API ຕ້ອງໄດ້ຮັບການພິສູດຢືນຢັນໂດຍໃຊ້ຄີ API ສະເພາະຂອງທ່ານ.
ຄີຄວນຖືກລວມຢູ່ໃນ the `Authorization` header ຂອງການຮ້ອງຂໍຂອງທ່ານເປັນ a Bearer token.
ນີ້ຮັບປະກັນວ່າການຮ້ອງຂໍທັງໝົດຂອງທ່ານມີຄວາມປອດໄພ ແລະ ຖືກເຊື່ອມໂຍງກັບບັນຊີຂອງທ່ານຢ່າງຖືກຕ້ອງສໍາລັບຈຸດປະສົງການເອີ້ນເກັບເງິນ ແລະ ການຕິດຕາມ.

ທ່ານຈະສົ່ງຄໍາຮ້ອງຂໍ `POST` ໄປຫາຈຸດສິ້ນສຸດ `/v2/document/translate`.
ຄໍາຮ້ອງຂໍນີ້ຈະເປັນຄໍາຮ້ອງຂໍ multipart/form-data ເພາະວ່າທ່ານກໍາລັງອັບໂຫລດໄຟລ໌.
ພາລາມິເຕີທີ່ຈໍາເປັນປະກອບມີ the `source_document` (ໄຟລ໌ PDF), `source_language` ທີ່ຖືກກໍານົດເປັນ `en`, ແລະ `target_language` ທີ່ຖືກກໍານົດເປັນ `ar`.

ຂັ້ນຕອນທີ 2: ການອັບໂຫລດ PDF ສໍາລັບການແປພາສາ

ຂັ້ນຕອນທໍາອິດທີ່ຫ້າວຫັນໃນຂະບວນການແມ່ນການອັບໂຫລດ PDF ພາສາອັງກິດຕົ້ນສະບັບຂອງທ່ານໄປຫາ API.
ລະຫັດຂ້າງລຸ່ມນີ້ສະແດງໃຫ້ເຫັນວິທີການເປີດໄຟລ໌ PDF ໃນໂຫມດອ່ານ binary ແລະສົ່ງມັນເປັນສ່ວນຫນຶ່ງຂອງ payload ການຮ້ອງຂໍ.
The `requests` library ເຮັດໃຫ້ມັນງ່າຍດາຍທີ່ຈະຈັດໂຄງສ້າງ multipart form data ນີ້ຢ່າງຖືກຕ້ອງ.

import requests
import time

# ແທນທີ່ດ້ວຍຄີ API ແລະ ເສັ້ນທາງໄຟລ໌ຕົວຈິງຂອງທ່ານ
API_KEY = "YOUR_API_KEY"
FILE_PATH = "path/to/your/document.pdf"

# ກໍານົດຈຸດສິ້ນສຸດຂອງ API
TRANSLATE_URL = "https://developer.doctranslate.io/v2/document/translate"

# ຕັ້ງຄ່າ authorization header
headers = {
    "Authorization": f"Bearer {API_KEY}"
}

# ກະກຽມຂໍ້ມູນການຮ້ອງຂໍ ແລະ ໄຟລ໌
data = {
    "source_language": "en",
    "target_language": "ar"
}

# ເປີດໄຟລ໌ໃນໂຫມດ binary ແລະ ສົ່ງຄໍາຮ້ອງຂໍ
with open(FILE_PATH, "rb") as file:
    files = {
        "source_document": (FILE_PATH, file, "application/pdf")
    }
    response = requests.post(TRANSLATE_URL, headers=headers, data=data, files=files)

# ກວດສອບວ່າຄໍາຮ້ອງຂໍເບື້ອງຕົ້ນສໍາເລັດແລ້ວບໍ
if response.status_code == 200:
    response_json = response.json()
    document_id = response_json.get("document_id")
    print(f"ອັບໂຫລດເອກະສານສຳເລັດແລ້ວ. Document ID: {document_id}")
else:
    print(f"ເກີດຂໍ້ຜິດພາດໃນການອັບໂຫລດເອກະສານ: {response.status_code} - {response.text}")
    document_id = None

ຂັ້ນຕອນທີ 3: ການຈັດການການຕອບສະໜອງ API ແບບ Asynchronous

ເມື່ອສົ່ງສໍາເລັດ, API ຈະບໍ່ສົ່ງຄືນໄຟລ໌ທີ່ແປທັນທີ.
ແທນທີ່ຈະ, ມັນຈະສົ່ງຄືນວັດຖຸ JSON ທີ່ມີ a `document_id`.
ນີ້ແມ່ນຍ້ອນວ່າການແປເອກະສານ, ໂດຍສະເພາະສໍາລັບ PDF ທີ່ສັບສົນ, ສາມາດໃຊ້ເວລາ, ແລະວິທີການ asynchronous ປ້ອງກັນບໍ່ໃຫ້ແອັບພລິເຄຊັນຂອງທ່ານຄ້າງ.

ແອັບພລິເຄຊັນຂອງທ່ານຄວນເກັບຮັກສາ this `document_id` ນີ້ ເພາະວ່າມັນເປັນຄີສໍາລັບການຕິດຕາມຄວາມຄືບຫນ້າຂອງວຽກການແປພາສາຂອງທ່ານ.
ທ່ານຈະໃຊ້ ID ນີ້ໃນການຮ້ອງຂໍ API ຕໍ່ມາ ເພື່ອກວດສອບສະຖານະການແປພາສາ.
ຂະບວນການເຮັດວຽກນີ້ແມ່ນເຂັ້ມແຂງ ແລະ ເໝາະສົມສໍາລັບການຈັດການການແປພາສາທຸກຂະຫນາດໂດຍບໍ່ເຮັດໃຫ້ເກີດການໝົດເວລາ.

ຂັ້ນຕອນທີ 4: ການກວດສອບສະຖານະ ແລະ ການດາວໂຫລດຜົນໄດ້ຮັບ

ເພື່ອກວດສອບສະຖານະ, ທ່ານຈະເຮັດການຮ້ອງຂໍ `GET` ໄປຫາຈຸດສິ້ນສຸດ `/v2/document/status/{document_id}`.
ສະຖານະຈະເປັນໜຶ່ງໃນຫຼາຍຄ່າ: `queued`, `processing`, `done`, ຫຼື `error`.
ສະຄຣິບຂອງທ່ານຄວນກວດສອບຈຸດສິ້ນສຸດນີ້ເປັນໄລຍະຈົນກວ່າສະຖານະຈະປ່ຽນເປັນ `done`.

ເມື່ອສະຖານະແມ່ນ `done`, ການຕອບສະໜອງຈະລວມເອົາ a `download_url` ຫຼືທ່ານສາມາດສ້າງລິ້ງດາວໂຫລດດ້ວຍຕົວທ່ານເອງໂດຍໃຊ້ຈຸດສິ້ນສຸດ `/v2/document/download/{document_id}`.
ຄໍາຮ້ອງຂໍ `GET` ສຸດທ້າຍໄປຫາຈຸດສິ້ນສຸດການດາວໂຫລດນີ້ຈະດຶງໄຟລ໌ PDF ພາສາອາຣັບທີ່ຖືກແປ.
ຕົວຢ່າງລະຫັດຕໍ່ໄປນີ້ສໍາເລັດສະຄຣິບຂອງພວກເຮົາໂດຍການປະຕິບັດກົນໄກການສໍາຫຼວດເພື່ອກວດສອບສະຖານະ ແລະ ດາວໂຫລດໄຟລ໌ສຸດທ້າຍ.

STATUS_URL = "https://developer.doctranslate.io/v2/document/status/"
DOWNLOAD_URL = "https://developer.doctranslate.io/v2/document/download/"

if document_id:
    while True:
        status_response = requests.get(f"{STATUS_URL}{document_id}", headers=headers)
        if status_response.status_code == 200:
            status_json = status_response.json()
            current_status = status_json.get("status")
            print(f"ສະຖານະການແປພາສາປັດຈຸບັນ: {current_status}")

            if current_status == "done":
                print("ການແປສຳເລັດແລ້ວ. ກໍາລັງດາວໂຫລດໄຟລ໌...")
                download_response = requests.get(f"{DOWNLOAD_URL}{document_id}", headers=headers)
                if download_response.status_code == 200:
                    # ບັນທຶກໄຟລ໌ທີ່ຖືກແປ
                    with open("translated_document_ar.pdf", "wb") as f:
                        f.write(download_response.content)
                    print("ໄຟລ໌ທີ່ຖືກແປຖືກບັນທຶກເປັນ translated_document_ar.pdf ແລ້ວ")
                else:
                    print(f"ເກີດຂໍ້ຜິດພາດໃນການດາວໂຫລດໄຟລ໌: {download_response.status_code}")
                break  # ອອກຈາກ loop
            elif current_status == "error":
                print(f"ເກີດຂໍ້ຜິດພາດໃນລະຫວ່າງການແປ: {status_json.get('message')}")
                break # ອອກຈາກ loop
        else:
            print("ເກີດຂໍ້ຜິດພາດໃນການເອົາສະຖານະ.")
            break

        # ລໍຖ້າ 10 ວິນາທີກ່ອນທີ່ຈະສໍາຫຼວດອີກຄັ້ງ
        time.sleep(10)

ຂໍ້ຄວນພິຈາລະນາທີ່ສໍາຄັນສໍາລັບການແປພາສາ PDF ຈາກພາສາອັງກິດເປັນພາສາອາຣັບ

ການແປຈາກພາສາຊ້າຍໄປຂວາ (LTR) ເຊັ່ນ ພາສາອັງກິດ ເປັນພາສາຂວາໄປຊ້າຍ (RTL) ເຊັ່ນ ພາສາອາຣັບ ເຮັດໃຫ້ເກີດຄວາມສັບສົນທີ່ເປັນເອກະລັກ.
ສິ່ງເຫຼົ່ານີ້ເກີນກວ່າການທົດແທນຄໍາສັບທໍາມະດາ ແລະ ຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈຢ່າງເລິກເຊິ່ງກ່ຽວກັບສົນທິສັນຍາທາງດ້ານພາສາສາດ ແລະ ການພິມ.
API ການແປພາສາ PDF ທີ່ມີຄຸນນະພາບສູງຕ້ອງຈັດການກັບຂໍ້ພິຈາລະນາເຫຼົ່ານີ້ໂດຍອັດຕະໂນມັດ ເພື່ອຜະລິດເອກະສານອາຣັບທີ່ມີລັກສະນະເປັນມືອາຊີບ ແລະ ເປັນທໍາມະຊາດ.

ການຈັດການຮູບແບບຂວາໄປຊ້າຍ (RTL)

ສິ່ງທ້າທາຍທີ່ສໍາຄັນທີ່ສຸດແມ່ນການປ່ຽນແປງທິດທາງການອ່ານຈາກ LTR ເປັນ RTL.
ນີ້ມີຜົນກະທົບຕໍ່ໂຄງສ້າງເອກະສານທັງຫມົດ; ຮູບແບບໜ້າເວັບມັກຈະຖືກສະທ້ອນ, ຖັນໃນຕາຕະລາງຖືກຈັດລຽງຄືນໃໝ່, ແລະ ຈຸດ bullet ຫຼື ລາຍການທີ່ມີຕົວເລກຈໍາເປັນຕ້ອງໄດ້ຈັດລຽງໃຫມ່.
ຕົວຢ່າງ, ຮູບແບບສອງຖັນໃນພາສາອັງກິດທີ່ມີຮູບພາບຢູ່ເບື້ອງຊ້າຍແລະຂໍ້ຄວາມຢູ່ເບື້ອງຂວາຄວນຖືກປີ້ນຢູ່ໃນພາສາອາຣັບເພື່ອໃຫ້ມີຮູບພາບຢູ່ເບື້ອງຂວາແລະຂໍ້ຄວາມຢູ່ເບື້ອງຊ້າຍ.

The Doctranslate API ຖືກອອກແບບມາສະເພາະເພື່ອຈັດການການປ່ຽນແປງ LTR-to-RTL ນີ້ຢ່າງລຽບງ່າຍ.
ມັນວິເຄາະໂຄງສ້າງຄວາມຫມາຍຂອງເອກະສານ ແລະນໍາໃຊ້ກົດລະບຽບການສະທ້ອນຮູບແບບທີ່ຖືກຕ້ອງໃນລະຫວ່າງໄລຍະການສ້າງຄືນໃຫມ່.
ນີ້ຮັບປະກັນວ່າ PDF ອາຣັບສຸດທ້າຍບໍ່ພຽງແຕ່ເປັນການເກັບກໍາຄໍາສັບທີ່ຖືກແປເທົ່ານັ້ນ ແຕ່ເປັນເອກະສານທີ່ຖືກຈັດຮູບແບບຢ່າງຖືກຕ້ອງທີ່ເຂົ້າໃຈງ່າຍສໍາລັບຜູ້ເວົ້າພາສາອາຣັບພື້ນເມືອງທີ່ຈະອ່ານ.

ການເລືອກຕົວອັກສອນ ແລະ ການສະແດງ Glyph ສໍາລັບພາສາອາຣັບ

ສະຄຣິບອາຣັບແມ່ນເປັນການຂຽນແບບຕໍ່ເນື່ອງ ແລະ ອ່ອນໄຫວຕໍ່ກັບບໍລິບົດ, ຫມາຍຄວາມວ່າຮູບຮ່າງຂອງຕົວອັກສອນຈະປ່ຽນແປງໂດຍອີງໃສ່ຕໍາແຫນ່ງຂອງມັນພາຍໃນຄໍາ.
ມັນຍັງອາໄສ ligatures ແລະ diacritics ຢ່າງຫຼວງຫຼາຍເພື່ອໃຫ້ສາມາດອ່ານໄດ້ແລະຖືກຕ້ອງ.
ການໃຊ້ຕົວອັກສອນທີ່ບໍ່ຮອງຮັບຄຸນສົມບັດເຫຼົ່ານີ້ຢ່າງຖືກຕ້ອງຈະສົ່ງຜົນໃຫ້ຕົວອັກສອນຖືກຕັດອອກ ຫຼື ຄໍາທີ່ຖືກສ້າງຂຶ້ນບໍ່ຖືກຕ້ອງ, ເຮັດໃຫ້ຂໍ້ຄວາມບໍ່ສາມາດອ່ານໄດ້.

API ຂອງພວກເຮົາຮັກສາ a curated library ທີ່ຄັດເລືອກຂອງຕົວອັກສອນອາຣັບທີ່ມີຄຸນນະພາບສູງທີ່ເຫມາະສົມສໍາລັບເອກະສານມືອາຊີບ.
ເມື່ອແປ PDF, ມັນເລືອກ ແລະ ຝັງຕົວອັກສອນທີ່ເຫມາະສົມຢ່າງສະຫຼາດ ເຊິ່ງຮັບປະກັນການສະແດງ glyph ທີ່ຖືກຕ້ອງ.
ການຈັດການຕົວອັກສອນແບບອັດຕະໂນມັດນີ້ຊ່ວຍປະຢັດຜູ້ພັດທະນາຈາກວຽກງານທີ່ສັບສົນແລະມີຂໍ້ຜິດພາດໃນການຈັດການການທົດແທນຕົວອັກສອນດ້ວຍຕົນເອງ.

ການຈັດການການຂະຫຍາຍ ແລະ ການຫົດຕົວຂອງຂໍ້ຄວາມ

ມັນເປັນຄວາມເຂົ້າໃຈຜິດທົ່ວໄປທີ່ວ່າການແປພາສາເຮັດໃຫ້ຂໍ້ຄວາມຍາວກວ່າສະເໝີ.
ໃນຂະນະທີ່ບາງພາສາຂະຫຍາຍອອກ, ພາສາອາຣັບມັກຈະສັ້ນກວ່າພາສາອັງກິດ, ເຊິ່ງນໍາໄປສູ່ການຫົດຕົວຂອງຂໍ້ຄວາມ.
ການປ່ຽນແປງຄວາມຍາວຂອງຂໍ້ຄວາມນີ້ສາມາດລົບກວນຮູບແບບຕົ້ນສະບັບ, ເຮັດໃຫ້ເກີດຊ່ອງຫວ່າງທີ່ບໍ່ສະດວກຂອງພື້ນທີ່ສີຂາວ ຫຼື, ໃນກໍລະນີຂອງການຂະຫຍາຍ, ຂໍ້ຄວາມລົ້ນອອກຈາກພາຊະນະຂອງມັນ.

ລະບົບການແປພາສາທີ່ຊັບຊ້ອນຕ້ອງສາມາດປັບຮູບແບບໃຫ້ຮອງຮັບການປ່ຽນແປງເຫຼົ່ານີ້.
The Doctranslate API ໃຊ້ dynamic layout adjustment algorithms ທີ່ສາມາດປັບຂະຫນາດຕົວອັກສອນ, ໄລຍະຫ່າງຂອງແຖວ, ຫຼື ຂອບໄດ້ຢ່າງລະອຽດອ່ອນ ເພື່ອຮັບປະກັນວ່າເນື້ອໃນທີ່ຖືກແປເຂົ້າກັນຢ່າງສົມບູນພາຍໃນຂອບເຂດຕົ້ນສະບັບຂອງມັນ.
ນີ້ຮັກສາລັກສະນະມືອາຊີບ ແລະ ຄວາມສົມດຸນຂອງເອກະສານໂດຍບໍ່ມີການແຊກແຊງດ້ວຍຕົນເອງ.

ສະຫຼຸບ ແລະ ຂັ້ນຕອນຕໍ່ໄປ

ການເຮັດໃຫ້ການແປເອກະສານ PDF ຈາກພາສາອັງກິດເປັນພາສາອາຣັບເປັນແບບອັດຕະໂນມັດແມ່ນບັນຫາທີ່ສັບສົນແຕ່ສາມາດແກ້ໄຂໄດ້ດ້ວຍເຄື່ອງມືທີ່ຖືກຕ້ອງ.
ພວກເຮົາໄດ້ສໍາຫຼວດສິ່ງທ້າທາຍພາຍໃນຂອງຮູບແບບ PDF, ຈາກໂຄງສ້າງທີ່ອີງໃສ່ພິກັດຂອງມັນໄປສູ່ຄວາມຕ້ອງການສະເພາະຂອງສະຄຣິບຂວາໄປຊ້າຍຂອງພາສາອາຣັບ.
ອຸປະສັກເຫຼົ່ານີ້ເຮັດໃຫ້ມັນຊັດເຈນວ່າວິທີແກ້ໄຂສະເພາະທີ່ຮູ້ຮູບແບບບໍ່ພຽງແຕ່ເປັນຄວາມສະດວກເທົ່ານັ້ນ ແຕ່ເປັນຄວາມຈໍາເປັນສໍາລັບການບັນລຸຜົນໄດ້ຮັບທີ່ເປັນມືອາຊີບ.

The Doctranslate API ສະໜອງວິທີແກ້ໄຂທີ່ມີປະສິດທິພາບ ແລະ ເປັນມິດກັບຜູ້ພັດທະນາ, ຈັດການວຽກໜັກຂອງການວິເຄາະ, ການແປພາສາ, ແລະ ການສ້າງຮູບແບບຄືນໃໝ່.
ໂດຍການປະຕິບັດຕາມຄູ່ມືການລວມເຂົ້າກັນເທື່ອລະຂັ້ນຕອນ, ທ່ານສາມາດລວມເອົາ API ການແປພາສາ PDF ທີ່ມີຄວາມຖືກຕ້ອງສູງສໍາລັບພາສາອັງກິດເປັນພາສາອາຣັບເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານໄດ້ຢ່າງວ່ອງໄວ.
ນີ້ຊ່ວຍໃຫ້ທ່ານສາມາດສົ່ງເອກະສານທີ່ຖືກແປຢ່າງຖືກຕ້ອງທີ່ຮັກສາການຈັດຮູບແບບມືອາຊີບຂອງຕົ້ນສະບັບໄວ້.

ຕອນນີ້ທ່ານມີຄວາມຮູ້ ແລະ ລະຫັດພ້ອມທີ່ຈະເລີ່ມສ້າງແລ້ວ.
ພວກເຮົາຊຸກຍູ້ໃຫ້ທ່ານສໍາຫຼວດເອກະສານ API ຢ່າງເປັນທາງການ ເພື່ອຄົ້ນພົບຄຸນສົມບັດຂັ້ນສູງເພີ່ມເຕີມ, ເຊັ່ນ: custom glossaries ແລະ ຮູບແບບການແປສະເພາະໂດເມນ.
ລົງທະບຽນສໍາລັບຄີ API ໃນມື້ນີ້ ແລະ ເລີ່ມສ້າງແອັບພລິເຄເຄຊັນທົ່ວໂລກທີ່ມີປະສິດທິພາບຫຼາຍຂຶ້ນສໍາລັບຜູ້ໃຊ້ຂອງທ່ານ.

Doctranslate.io - ການແປພາສາທີ່ວ່ອງໄວ, ຖືກຕ້ອງໃນທົ່ວຫຼາຍພາສາ

Để lại bình luận

chat