ອົງກອນວິສາຫະກິດມັກຈະພົບກັບອຸປະສັກທີ່ສັບສົນເມື່ອ ດຳ ເນີນການແປຮູບພາບຈາກສະເປນເປັນລັດເຊຍສຳລັບເອກະສານທົ່ວໂລກຂອງພວກເຂົາ.
ການນຳທາງການປ່ຽນຈາກຕົວອັກສອນລາຕິນຂອງສະເປນໄປເປັນຕົວອັກສອນຊີຣິລິກຂອງລັດເຊຍຮຽກຮ້ອງໃຫ້ມີຄວາມເຂົ້າໃຈທີ່ສັບສົນກ່ຽວກັບການປ່ຽນແປງຂອງການຈັດວາງ ແລະ ການສະແດງຕົວອັກສອນ ເພື່ອຮັບປະກັນວ່າແຜນການທາງດ້ານວິຊາການຍັງຄົງເປັນມືອາຊີບ ແລະ ຖືກຕ້ອງ.
ຖ້າບໍ່ມີຍຸດທະສາດທີ່ເຂັ້ມແຂງ, ການປ່ຽນແປງດັ່ງກ່າວມັກຈະສົ່ງຜົນໃຫ້ຊັບສິນທີ່ແຕກຫັກທາງສາຍຕາ ເຊິ່ງສ້າງຄວາມສັບສົນໃຫ້ກັບຜູ້ມີສ່ວນຮ່ວມ ແລະ ລູກຄ້າທັງສອງຝ່າຍ.
ເປັນຫຍັງໄຟລ໌ຮູບພາບຈຶ່ງມັກຈະແຕກເມື່ອແປຈາກສະເປນເປັນລັດເຊຍ
ຄຳອະທິບາຍທາງດ້ານເຕັກນິກສຳລັບເຫດຜົນທີ່ຮູບພາບລົ້ມເຫຼວໃນລະຫວ່າງການແປຮູບພາບຈາກສະເປນເປັນລັດເຊຍເລີ່ມຕົ້ນດ້ວຍຄວາມແຕກຕ່າງພື້ນຖານໃນສະຖາປັດຕະຍະກຳຂອງຕົວອັກສອນ.
ພາສາສະເປນອີງໃສຕົວອັກສອນລາຕິນ, ເຊິ່ງໂດຍທົ່ວໄປແລ້ວມີການແຈກຢາຍຕົວອັກສອນໃນແນວຕັ້ງ ແລະ ແນວນອນທີ່ສົມດຸນ.
ໃນທາງກົງກັນຂ້າມ, ຕົວອັກສອນຊີຣິລິກຂອງລັດເຊຍມັກຈະກວ້າງກວ່າ ແລະ ໜາແໜ້ນໃນແນວຕັ້ງ, ຮຽກຮ້ອງໃຫ້ມີພິກເຊວຫຼາຍຂຶ້ນຕໍ່ຕົວອັກສອນເພື່ອຮັກສາຄວາມຊັດເຈນ.
ຄວາມແຕກຕ່າງນີ້ເຮັດໃຫ້ເຄື່ອງຈັກ Optical Character Recognition (OCR) ທຳມະດາມີຄວາມຫຍຸ້ງຍາກໃນການຈັດວາງໄລຍະຫ່າງຂອງຕົວອັກສອນ ແລະ ການສອດຄ່ອງຂອງເສັ້ນພື້ນຖານ.
ການຂະຫຍາຍຕົວຂອງພາສາແມ່ນປັດໄຈສຳຄັນອີກອັນໜຶ່ງທີ່ນຳໄປສູ່ການເສຍຫາຍທາງສາຍຕາໃນຮູບພາບທີ່ແປແລ້ວ.
ເມື່ອແປຈາກພາສາສະເປນເປັນລັດເຊຍ, ຄວາມຍາວຂອງຂໍ້ຄວາມສາມາດເພີ່ມຂຶ້ນໄດ້ເຖິງ 30% ຂຶ້ນຢູ່ກັບລັກສະນະທາງດ້ານວິຊາການຂອງເນື້ອໃນ.
ປ້າຍຊື່ພາສາສະເປນທີ່ກະທັດຮັດທີ່ພໍດີຢູ່ໃນປຸ່ມ ຫຼື ກ່ອງໂທອອກອາດຈະລົ້ນເມື່ອປ່ຽນເປັນພາສາລັດເຊຍ.
ການຂະຫຍາຍຕົວນີ້ບັງຄັບໃຫ້ເຄື່ອງຈັກສະແດງຜົນທັງຫຼຸດຂະໜາດຕົວອັກສອນໃຫ້ເຫຼືອຂະໜາດທີ່ອ່ານບໍ່ໄດ້ ຫຼື ຕັດຂໍ້ຄວາມອອກທັງໝົດ.
ຄວາມຂັດແຍ້ງໃນການເຂົ້າລະຫັດເຮັດໃຫ້ຂະບວນການສ້າງຮູບພາບໃນທ້ອງຖິ່ນສຳລັບການນຳໃຊ້ຂອງວິສາຫະກິດສັບສົນຍິ່ງຂຶ້ນ.
ເອກະສານພາສາສະເປນແບບເກົ່າຈຳນວນຫຼາຍໃຊ້ຊຸດຕົວອັກສອນສະເພາະທີ່ບໍ່ກົງກັບບລັອກ Unicode ຂອງຊີຣິລິກໃນລະຫວ່າງການສະກັດຂໍ້ມູນອັດຕະໂນມັດ.
ຖ້າຊອບແວການແປພາສາບໍ່ຈັດການຊຸດຕົວອັກສອນຫຼາຍ-byte ຢ່າງຖືກຕ້ອງ, ຮູບພາບຜົນໄດ້ຮັບຈະສະແດງເປັນ “tofu” ຫຼື ສັນຍາລັກສີ່ຫຼ່ຽມທີ່ແຕກຫັກ.
ທີມງານວິສາຫະກິດຄວນຊອກຫາວິທີແກ້ໄຂທີ່ສາມາດ <a href=

Để lại bình luận