ເປັນຫຍັງໄຟລ໌ຮູບພາບຈຶ່ງມັກຈະເສຍຫາຍເມື່ອແປຈາກລັດເຊຍເປັນເຍຍລະມັນ
ການແປເນື້ອຫາເບິ່ງເຫັນລະຫວ່າງລັດເຊຍແລະເຍຍລະມັນນໍາສະເຫນີຄວາມທ້າທາຍທາງດ້ານວິຊາການທີ່ເປັນເອກະລັກເຊິ່ງມັກຈະເຮັດໃຫ້ເກີດການຈັດວາງທີ່ເສຍຫາຍ.
ຄວາມທ້າທາຍຫຼັກແມ່ນຢູ່ໃນຄວາມແຕກຕ່າງຢ່າງຮຸນແຮງລະຫວ່າງຮູບຮ່າງແລະຄວາມກວ້າງຂອງຕົວອັກສອນຂອງ Cyrillic ແລະ Latin.
ເມື່ອທ່ານປະຕິບັດການແປຮູບພາບຈາກລັດເຊຍເປັນເຍຍລະມັນ, ຂໍ້ຄວາມຕົ້ນສະບັບມັກຈະໃຊ້ພື້ນທີ່ໃນແນວນອນຫນ້ອຍກວ່າຂໍ້ຄວາມເຍຍລະມັນທີ່ໄດ້ຮັບ.
ຄວາມແຕກຕ່າງນີ້ກະຕຸ້ນໃຫ້ເກີດຂໍ້ຜິດພາດໃນການຈັດຮູບແບບທີ່ຈະເຮັດໃຫ້ເອກະສານມືອາຊີບເບິ່ງບໍ່ເປັນມືອາຊີບຫຼືອ່ານບໍ່ໄດ້.
ພາສາເຍຍລະມັນມີຊື່ສຽງທາງດ້ານພາສາສໍາລັບຄໍາປະສົມຂອງມັນ, ເຊິ່ງຍາວກວ່າຄໍາສັບພາສາລັດເຊຍທໍາມະດາຫຼາຍ.
ໃນຮູບແບບຮູບພາບຄົງທີ່, ເຊັ່ນ PNG ຫຼື JPEG, ຂໍ້ຄວາມມັກຈະຖືກຈໍາກັດຢູ່ໃນກ່ອງຂອບເຂດທີ່ກໍານົດໄວ້ໃນລະຫວ່າງການອອກແບບ.
ຖ້າເຄື່ອງມືແປພາສາບໍ່ຄໍານຶງເຖິງການຂະຫຍາຍຕົວນີ້, ຂໍ້ຄວາມເຍຍລະມັນຈະຂະຫຍາຍອອກຈາກກ່ອງຫຼືຖືກຕັດອອກຫມົດ.
ນີ້ສ້າງພາລະຄູ່ມືອັນໃຫຍ່ຫຼວງສໍາລັບນັກອອກແບບທີ່ຕ້ອງສ້າງຊັບສິນເບິ່ງເຫັນທັງຫມົດຄືນໃຫມ່ຕັ້ງແຕ່ເລີ່ມຕົ້ນ.
ນອກຈາກນັ້ນ, ຂໍ້ມູນຈໍາເພາະທາງດ້ານວິຊາການພາຍໃນໄຟລ໌ຮູບພາບມັກຈະມີບັນຫາກັບການຮັກສາການແຍກຊັ້ນໃນລະຫວ່າງຂະບວນການ OCR ອັດຕະໂນມັດ.
ເຄື່ອງມືມາດຕະຖານມັກຈະເຮັດໃຫ້ຊັ້ນເຫຼົ່ານີ້ຮາບພຽງ, ປະສົມຂໍ້ຄວາມກັບພື້ນຫລັງໃນລັກສະນະທີ່ເຮັດໃຫ້ການແກ້ໄຂທີ່ສະອາດເປັນໄປບໍ່ໄດ້.
ສະພາບແວດລ້ອມວິສາຫະກິດຕ້ອງການວິທີການທີ່ສັບສົນກວ່າທີ່ຖືວ່າຮູບພາບເປັນການເກັບກໍາອົງປະກອບທາງຄວາມຫມາຍແທນທີ່ຈະເປັນຕາລາງພິກະເຊວຮາບພຽງ.
ໂດຍບໍ່ມີການແບ່ງສ່ວນອັດສະລິຍະ, ການປ່ຽນຈາກລັດເຊຍເປັນເຍຍລະມັນສົ່ງຜົນໃຫ້ຮູບພາບບິດເບືອນແລະຄໍາຊີ້ແຈງທີ່ບໍ່ສອດຄ່ອງ.
ບົດບາດຂອງຄວາມຫນາແຫນ້ນຂອງພິກະເຊວແລະຄວາມສັບສົນຂອງຕົວອັກສອນ
ຕົວອັກສອນ Cyrillic ຂອງລັດເຊຍມັກຈະມີຄວາມຫນາແຫນ້ນໃນການເບິ່ງເຫັນສູງກວ່າເມື່ອທຽບກັບຕົວອັກສອນ Latin ຂອງເຍຍລະມັນທີ່ເປັນເສັ້ນກວ່າ.
ເມື່ອເຄື່ອງມື OCR ສະແກນຕົວອັກສອນເຫຼົ່ານີ້, ມັນຕ້ອງນໍາທາງຜ່ານເສັ້ນເລືອດຂອງຕົວອັກສອນ Cyrillic ໃນຂະນະທີ່ຮັກສາຄວາມຖືກຕ້ອງສູງ.
ອັລກໍຣິທຶມທີ່ຖືກປັບໃຫ້ເຫມາະສົມບໍ່ດີມັກຈະຕີຄວາມຫມາຍຕົວອັກສອນລັດເຊຍຜິດ, ນໍາໄປສູ່ຂໍ້ຄວາມ

Để lại bình luận