ອົງກອນວິສາຫະກິດມັກຈະປະເຊີນກັບອຸປະສັກທາງດ້ານເຕັກນິກທີ່ສໍາຄັນເມື່ອຈັດການກັບການແປເອກະສານຈາກພາສາອັງກິດເປັນພາສາປໍຕຸເກດໃນລະດັບໃຫຍ່.
ໃນຂະນະທີ່ການປ່ຽນແປງທາງດ້ານພາສາເປັນຂໍ້ກັງວົນຫຼັກ, ຄວາມສົມบูรณ์ຂອງໂຄງສ້າງຂອງໄຟລ໌ມັກຈະເປັນສິ່ງທ້າທາຍທີ່ສຸດສໍາລັບພະແນກ IT.
ເຄື່ອງມືແປພາສາມາດຕະຖານມັກຈະບໍ່ສົນໃຈ metadata ທີ່ສັບສົນ ແລະ ຂໍ້ຈໍາກັດການຈັດວາງທີ່ກໍານົດເອກະສານແບບມືອາຊີບໃນສະພາບແວດລ້ອມຂອງອົງກອນ.
ເປັນຫຍັງໄຟລ໌ເອກະສານຈຶ່ງມັກຈະແຕກເມື່ອແປຈາກພາສາອັງກິດເປັນພາສາປໍຕຸເກດ
ເຫດຜົນຫຼັກສໍາລັບເອກະສານແຕກໃນລະຫວ່າງການແປແມ່ນປາກົດການທີ່ເອີ້ນວ່າການຂະຫຍາຍຂໍ້ຄວາມ (text expansion).
ຂໍ້ຄວາມພາສາປໍຕຸເກດມັກຈະຍາວກວ່າ 20 ຫາ 30 ສ່ວນຮ້ອຍເມື່ອທຽບກັບພາສາອັງກິດ, ເຊິ່ງສ້າງຄວາມຂັດແຍ້ງທາງດ້ານພື້ນທີ່ທັນທີພາຍໃນໂຄງສ້າງໄຟລ໌.
ເມື່ອເອກະສານຖືກອອກແບບມາດ້ວຍກ່ອງທີ່ມີຄວາມກວ້າງຄົງທີ່, ຂໍ້ຄວາມພິເສດນີ້ຈະບໍ່ມີບ່ອນຢູ່ອື່ນນອກຈາກນອກຂອບເຂດຂອງການອອກແບບເດີມ.
ຮູບແບບເອກະສານທີ່ທັນສະໄໝເຊັ່ນ DOCX ແລະ PDF ແມ່ນອີງໃສ່ຮູບແບບ XML ທີ່ສັບສົນ ແລະ ລະບົບການກໍານົດຕົໍາແຫນ່ງເພື່ອຮັກສາຄວາມສອດຄ່ອງທາງສາຍຕາ.
ໃນລະຫວ່າງການແປເອກະສານຈາກພາສາອັງກິດເປັນພາສາປໍຕຸເກດ, ຕົວແຍກວິເຄາະແບບດັ້ງເດີມມັກຈະລົ້ມເຫລວໃນການຄິດໄລ່ຕົໍາແຫນ່ງເຫຼົ່ານີ້ຄືນໃໝ່ເພື່ອຮອງຮັບສາຍຂໍ້ຄວາມທີ່ຍາວກວ່າ.
ຄວາມລົ້ມເຫລວນີ້ເຮັດໃຫ້ຂໍ້ຄວາມທັບຊ້ອນກັບຮູບພາບ, ຫົວຂໍ້ເລື່ອນເຂົ້າໄປໃນເນື້ອໃນຫຼັກ, ແລະທ້າຍເອກະສານຖືກຍູ້ໄປໜ້າໃໝ່ທັງໝົດ.
ນອກເຫນືອຈາກການຂະຫຍາຍຂໍ້ຄວາມແບບງ່າຍໆ, ການເຂົ້າລະຫັດຕົວອັກສອນ (character encoding) ມີບົດບາດສໍາຄັນໃນຄວາມຫມັ້ນຄົງຂອງເອກະສານ.
ພາສາປໍຕຸເກດໃຊ້ເຄື່ອງໝາຍເສີມ ແລະ ຕົວອັກສອນພິເສດທີ່ຫຼາກຫຼາຍ, ເຊັ່ນ cedilla ແລະເຄື່ອງໝາຍການເນັ້ນສຽງຕ່າງໆ, ເຊິ່ງບໍ່ມີໃນພາສາອັງກິດມາດຕະຖານ.
ຖ້າໂຄງສ້າງເອກະສານພື້ນຖານ ຫຼື ເຄື່ອງມືແປພາສາບໍ່ຮອງຮັບການເຂົ້າລະຫັດ UTF-8 ເຕັມຮູບແບບ, ຕົວອັກສອນເຫຼົ່ານີ້ຈະປາກົດເປັນສັນຍາລັກທີ່ເສຍຫາຍ ຫຼື ບລັອກ

Để lại bình luận