Doctranslate.io

Translate PDF Vietnamese to Russian | Layout Preservation Guide

Đăng bởi

vào

ໃນຍຸກການຄ້າໂລກສະໄໝໃໝ່, ຄວາມຕ້ອງການໃນການແປເອກະສານທີ່ມີຄຸນນະພາບສູງລະຫວ່າງ ອາຊີຕາເວັນອອກສຽງໃຕ້ ແລະ ຢູໂຣບຕາເວັນອອກ ໄດ້ເພີ່ມຂຶ້ນສູງຂຶ້ນ.
ໂດຍສະເພາະ, ຂະບວນການແປ PDF ພາສາຫວຽດນາມເປັນພາສາລັດເຊຍ ໄດ້ກາຍເປັນສາຍວຽກທີ່ສຳຄັນສຳລັບບໍລິສັດໂລຈິສຕິກ, ກົດໝາຍ, ແລະ ການຜະລິດ.
ບໍລິສັດມັກຈະປະສົບກັບອຸປະສັກທາງເທັກນິກທີ່ສຳຄັນເມື່ອຍ້າຍຂໍ້ມູນທີ່ສັບສົນຂ້າມລະບົບພາສາ ແລະ ຕົວອັກສອນທີ່ແຕກຕ່າງກັນຢ່າງຫຼວງຫຼາຍເຫຼົ່ານີ້.

ການຈັດການເອກະສານຂະໜາດໃຫຍ່ຮຽກຮ້ອງຫຼາຍກວ່າການແປຄຳສັບເທົ່ານັ້ນ.
ມັນກ່ຽວຂ້ອງກັບການຮັກສາຄວາມສົມບູນຂອງໂຄງສ້າງຂອງຮູບແບບເອກະສານແບບພົກພາ (PDF) ເຊິ່ງເປັນທີ່ຮູ້ກັນວ່າແກ້ໄຂຍາກ.
ເມື່ອທີມງານວິສາຫະກິດພະຍາຍາມປ່ຽນແປງນີ້, ພວກເຂົາມັກຈະພົບກັບການອອກແບບທີ່ແຕກຫັກເຊິ່ງຮຽກຮ້ອງໃຫ້ມີການແກ້ໄຂດ້ວຍຕົນເອງເປັນເວລາຫຼາຍຊົ່ວໂມງ.
ຄູ່ມືນີ້ຈະສຳຫຼວດວ່າເປັນຫຍັງຄວາມລົ้มເຫຼົ່ານີ້ຈຶ່ງເກີດຂຶ້ນ ແລະ AI ສະໄໝໃໝ່ສາມາດແກ້ໄຂໄດ້ແນວໃດ.

ເປັນຫຍັງໄຟລ໌ PDF ຈຶ່ງແຕກເມື່ອແປຈາກພາສາຫວຽດນາມເປັນພາສາລັດເຊຍ

ຮາກຂອງບັນຫາແມ່ນຢູ່ໃນຄວາມແຕກຕ່າງພື້ນຖານລະຫວ່າງຕົວອັກສອນຫວຽດນາມທີ່ອີງໃສ່ພາສາລາຕິນ ແລະ ຕົວອັກສອນລັດເຊຍທີ່ອີງໃສ່ພາສາຊີຣິລິກ.
ພາສາຫວຽດນາມໃຊ້ລະບົບ diacritics ແລະ tone marks ທີ່ກວ້າງຂວາງເຊິ່ງຮຽກຮ້ອງໃຫ້ມີການປັບໄລຍະຫ່າງຂອງຕົວອັກສອນ (kerning) ແລະ ໄລຍະຫ່າງເສັ້ນ (line-height) ສະເພາະ.
ໃນທາງກົງກັນຂ້າມ, ຕົວອັກສອນ Cyrillic ຂອງລັດເຊຍມັກຈະກວ້າງກວ່າ ແລະ ມີອັດຕາສ່ວນຕັ້ງທີ່ແຕກຕ່າງກັນເມື່ອທຽບກັບຕົວອັກສອນລາຕິນ.
ຄວາມບໍ່ສອດຄ່ອງນີ້ເຮັດໃຫ້ເກີດຄວາມຂັດແຍ້ງທາງພື້ນທີ່ທັນທີພາຍໃນພາຊະນະ PDF ທີ່ຖືກກຳນົດ.

ເອກະສານ PDF ບໍ່ໄດ້ມີການເຄື່ອນໄຫວຄືກັບໄຟລ໌ HTML ຫຼື Word; ພວກມັນໃຊ້ຕຳແໜ່ງທີ່ແນ່ນອນສຳລັບທຸກຕົວອັກສອນ.
ເມື່ອປະໂຫຍກພາສາຫວຽດນາມຖືກແທນທີ່ດ້ວຍຄຳສັບລັດເຊຍທີ່ສອດຄ້ອງກັນ, ຈຳນວນຕົວອັກສອນ ແລະ ຄວາມກວ້າງທັງໝົດມັກຈະຂະຫຍາຍຂຶ້ນ 20% ຫາ 30%.
ຖ້າບໍ່ມີເຄື່ອງຈັກທີ່ເຂົ້າໃຈຮູບແບບ, ຂໍ້ຄວາມທີ່ແປແລ້ວພຽງແຕ່ຈະລົ້ນອອກຈາກກ່ອງຂໍ້ຄວາມທີ່ກຳນົດໄວ້ ຫຼື ທັບຊ້ອນກັບອົງປະກອບອື່ນໆ.
ນີ້ເຮັດໃຫ້ເອກະສານທີ່ເບິ່ງເຫັນບໍ່ສາມາດອ່ານໄດ້ ແລະ ບໍ່ເປັນມືອາຊີບສຳລັບການນຳໃຊ້ໃນວິສາຫະກິດ.

ຍິ່ງໄປກວ່ານັ້ນ, ມາດຕະຖານການເຂົ້າລະຫັດລະຫວ່າງສອງພາສານີ້ມັກຈະຂັດແຍ້ງກັນພາຍໃນ metadata ຂອງ PDF.
ເອກະສານຫວຽດນາມມັກຈະໃຊ້ການເຂົ້າລະຫັດແບບເກົ່າເຊັ່ນ TCVN3 ຫຼື VNI ພ້ອມກັບມາດຕະຖານ Unicode ສະໄໝໃໝ່.
ເອກະສານລັດເຊຍຕ້ອງການການຮອງຮັບທີ່ເຂັ້ມແຂງສຳລັບ UTF-8 ຫຼື Windows-1251 ເພື່ອສະແດງຕົວອັກສອນ Cyrillic ຢ່າງຖືກຕ້ອງ.
ຖ້າເຄື່ອງຈັກການແປພາສາບໍ່ຈັດການການປ່ຽນແຜນທີ່ຕົວອັກສອນ (font re-mapping), ຜົນໄດ້ຮັບອາດຈະເປັນຂໍ້ຄວາມທີ່ສັບສົນ ເຊິ່ງເອີ້ນວ່າ mojibake.

ເພື່ອຮັບປະກັນຜົນໄດ້ຮັບທີ່ເປັນມືອາຊີບ, ບໍລິສັດຕ້ອງໃຊ້ລະບົບທີ່ເຂົ້າໃຈຄຸນສົມບັດທາງເລຂາຄະນິດຂອງໄຟລ໌ຕົ້ນສະບັບ.
ທ່ານສາມາດ <a href=

Để lại bình luận

chat