Doctranslate.io

English to Japanese Image Translation: Fix Layout & Font Issues

작성

ເປັນຫຍັງໄຟລ໌ຮູບພາບຈຶ່ງມັກຈະແຕກເມື່ອແປຈາກພາສາອັງກິດເປັນພາສາຍີ່ປຸ່ນ

ການຈັດການການແປຮູບພາບຈາກອັງກິດເປັນຍີ່ປຸ່ນເປັນວຽກທີ່ຍາກລຳບາກສຳລັບທີມງານການແປພາສາໃນວິສາຫະກິດເນື່ອງຈາກຄວາມແຕກຕ່າງທາງພາສາທີ່ກວ້າງຂວາງ.
ເຄື່ອງມືການຮັບຮູ້ຕົວອັກສອນທາງສາຍຕາ (OCR) ແບບດັ້ງເດີມມັກຈະລົ้มເຫຼວໃນການຮັບຮູ້ຄວາມຕ້ອງການຊ່ອງຫວ່າງລະຫວ່າງຕົວອັກສອນລາຕິນ ແລະ ຕົວອັກສອນຍີ່ປຸ່ນທີ່ສັບສົນ.
ຄວາມແຕກຕ່າງນີ້ເຮັດໃຫ້ເກີດການຈັດວາງທີ່ແຕກຫັກບ່ອນທີ່ຂໍ້ຄວາມອອກນອກກ່ອງບັນຈຸ ຫຼື ຫາຍໄປໝົດໃນລະຫວ່າງຂະບວນການສະແດງຜົນ.

ເຫດຜົນທາງວິຊາການຫຼັກສຳລັບການແຕກຫັກເຫຼົ່ານີ້ແມ່ນຄວາມແຕກຕ່າງຂອງຄວາມໜາແໜ້ນຂອງຕົວອັກສອນ ແລະ ທິດທາງລະຫວ່າງສອງພາສາ.
ພາສາອັງກິດເປັນພາສາຕົວອັກສອນທີ່ອີງໃສ່ຕົວອັກສອນທີ່ມີຄວາມກວ້າງແຕກຕ່າງກັນ ແລະ ຊ່ອງຫວ່າງໃນແນວນອນເພື່ອ ກຳນົດຂອບເຂດຂອງຄຳສັບ.
ໃນທາງກົງກັນຂ້າມ, ພາສາຍີ່ປຸ່ນໃຊ້ການປະສົມປະສານຂອງ Kanji, Hiragana, ແລະ Katakana, ເຊິ່ງໂດຍທົ່ວໄປແລ້ວແມ່ນມີຄວາມກວ້າງຄົງທີ່ ແລະ ມີຄວາມໜາແໜ້ນທາງສາຍຕາຫຼາຍກວ່າຄູ່ຮ່ວມພາສາອັງກິດຂອງພວກມັນ.

ຍິ່ງໄປກວ່ານັ້ນ, ທຳມະຊາດໃນແນວນອນຂອງຂໍ້ຄວາມພາສາອັງກິດມັກຈະຂັດແຍ້ງກັບຕົວອັກສອນຍີ່ປຸ່ນ, ເຊິ່ງໃນອະດີດຮອງຮັບທັງຮູບແບບການຂຽນໃນແນວນອນ ແລະ ແນວຕັ້ງ.
ເມື່ອລະບົບອັດຕະໂນມັດພະຍາຍາມບັງຄັບໃສ່ຕົວອັກສອນຍີ່ປຸ່ນເຂົ້າໄປໃນຊ່ອງຫວ່າງທີ່ອອກແບບມາສຳລັບຕົວອັກສອນພາສາອັງກິດທີ່ແຄບ, ເຫດຜົນການຈັດວາງມັກຈະລົ້ມລົງ.
ສິ່ງນີ້ສົ່ງຜົນໃຫ້ປະໂຫຍກທີ່ແຕກຫັກ ແລະ ອົງປະກອບກຣາຟິກທີ່ທັບຊ້ອນກັນເຊິ່ງຕ້ອງການຊົ່ວໂມງແກ້ໄຂດ້ວຍຕົນເອງໂດຍຜູ້ຊ່ຽວຊານດ້ານການພິມເດັສທັອບ.

ປັດໃຈສຳຄັນອີກຢ່າງໜຶ່ງແມ່ນຂະບວນການ “In-painting” ຫຼື ການຟື້ນຟູບໍລbackground ທີ່ຕ້ອງການຫຼັງຈາກການລຶບຂໍ້ຄວາມຕົ້ນສະບັບ.
ເນື່ອງຈາກຕົວອັກສອນຍີ່ປຸ່ນມັກຈະສູງກວ່າຕົວອັກສອນພິມນ້ອຍພາສາອັງກິດ, ລະບົບຕ້ອງສ້າງພື້ນທີ່ຂອງຮູບພາບຄືນໃໝ່ໃນພື້ນທີ່ທີ່ໃຫຍ່ກວ່າ.
ຖ້າອັນກໍລິດຶມການຟື້ນຟູບໍ່ມີຄວາມຊັບຊ້ອນພຽງພໍ, ມັນຈະສ້າງສັນລາຍການທາງສາຍຕາທີ່ເຮັດໃຫ້ຮູບພາບທີ່ແປອອກມາເບິ່ງບໍ່ເປັນມືອາຊີບ ແລະ ຫຍຸ້ງຍາກ.

ລາຍການບັນຫາທົ່ວໄປໃນການແປຮູບພາບຈາກອັງກິດເປັນຍີ່ປຸ່ນ

ຕົວອັກສອນເສຍຫາຍ ແລະ ຕົວອັກສອນ Tofu

ໜຶ່ງໃນບັນຫາທີ່ພົບເລື້ອຍທີ່ສຸດໃນການແປຮູບພາບຈາກອັງກິດເປັນຍີ່ປຸ່ນແມ່ນຄວາມເສຍຫາຍຂອງຕົວອັກສອນ, ເຊິ່ງມັກຈະຖືກເອີ້ນວ່າ “tofu.”
ສິ່ງນີ້ເກີດຂຶ້ນເມື່ອເຄື່ອງມືສະແດງຜົນຂາດສັນຍາລັກທີ່ຕ້ອງການເພື່ອສະແດງຕົວອັກສອນ Kanji ຫຼື Hiragana ຢ່າງຖືກຕ້ອງ.
ແທນທີ່ຈະເປັນຕົວໜັງສືຍີ່ປຸ່ນທີ່ສວຍງາມ, ຜູ້ຊົມເຫັນກ່ອງເປົ່າ, ເຊິ່ງທຳລາຍປະໂຫຍດຂອງເອກະສານທີ່ແປຢ່າງສົມບູນ.

ວິສາຫະກິດມັກຈະໃຊ້ຕົວອັກສອນຂອງບໍລິສັດທີ່ກຳນົດເອງເຊິ່ງບໍ່ມີການຮອງຮັບໃນຕົວສຳລັບຊຸດຕົວອັກສອນເອເຊຍຕາເວັນອອກ.
ຖ້າບໍ່ມີລະບົບສຳຮອງຕົວອັກສອນອັດສະລິຍະ, ໂປຣແກຣມແປພາສາມັກຈະປ່ຽນເປັນຕົວອັກສອນ सिष्टิມທົ່ວໄປທີ່ອາດຈະບໍ່ກົງກັບຄວາມງາມຕົ້ນສະບັບ.
ຄວາມບໍ່ສອດຄ່ອງນີ້ສ້າງຄວາມເສຍຫາຍໂດຍສະເພາະສຳລັບສື່ການຕະຫຼາດ ແລະ ອິນໂຟກຣາຟິກທີ່ລະອຽດອ່ອນຕໍ່ຍີ່ຫໍ້ບ່ອນທີ່ຄວາມກົມກຽວທາງສາຍຕາເປັນສິ່ງຈຳເປັນສຳລັບຄວາມໄວ້ວາງໃຈຂອງຜູ້ບໍລິໂພກ.

ການຈັດຕາຕະລາງບໍ່ຖືກຕ້ອງ ແລະ ການຮົ່ວໄຫຼຂອງຫ້ອງ

ຮູບພາບທີ່ມີຕາຕະລາງ ຫຼື ຂໍ້ມູນທີ່ມີໂຄງສ້າງໂດຍສະເພາະມີແນວໂນ້ມທີ່ຈະຈັດຕາຕະລາງບໍ່ຖືກຕ້ອງໃນລະຫວ່າງຂະບວນການແປພາສາ.
ຂໍ້ຄວາມພາສາອັງກິດໃນຕາຕະລາງມັກຈະກະທັດຮັດ, ແຕ່ການແປພາສາຍີ່ປຸ່ນອາດຕ້ອງການພື້ນທີ່ໃນແນວຕັ້ງຫຼາຍຂຶ້ນເພື່ອຮັກສາຄວາມສາມາດໃນການອ່ານໃນຂະໜາດຕົວອັກສອນທີ່ນ້ອຍກວ່າ.
ນີ້ເຮັດໃຫ້ຂໍ້ຄວາມໄຫຼອອກຈາກຫ້ອງຕາຕະລາງ ຫຼື ທັບຊ້ອນກັບຂອບ, ເຮັດໃຫ້ຂໍ້ມູນບໍ່ສາມາດตีความໄດ້ສຳລັບຜູ້ໃຊ້ສຸດທ້າຍ.

ເພື່ອຮັກສາຄວາມສົມບູນຂອງໂຄງສ້າງ, ລະບົບຕ້ອງປັບການຕື່ມຂໍ້ມູນ ແລະ ຄວາມສູງຂອງແຖວໃນຮູບພາບດ້ວຍຕົວມັນເອງແບບເຄື່ອນໄຫວ.
ເຄື່ອງມືການແປພາສາພື້ນຖານສ່ວນໃຫຍ່ຂາດຄວາມຮັບຮູ້ກ່ຽວກັບຂອບເຂດໂຄງສ້າງພາຍໃນໄຟລ໌ຮູບພາບທີ່ເປັນຮູບແບບ Rasterized.
ດັ່ງນັ້ນ, ຜົນໄດ້ຮັບຮຽກຮ້ອງໃຫ້ມີການແກ້ໄຂຢ່າງກວ້າງຂວາງ, ເຊິ່ງເຮັດໃຫ້ຜົນປະໂຫຍດໃນການປະຢັດເວລາຂອງການນໍາໃຊ້ການແກ້ໄຂອັດຕະໂນມັດໃນບ່ອນທໍາອິດ.

ການຍົກຍ້າຍຮູບພາບ ແລະ ຂໍ້ຜິດພາດຂອງຊັ້ນ

ຮູບພາບທີ່ສັບສົນມັກຈະປະກອບດ້ວຍຊັ້ນຫຼາຍ ຫຼື ຂໍ້ຄວາມທີ່ວາງຊ້ອນກັນເຊິ່ງພົວພັນກັບອົງປະກອບກຣາຟິກສະເພາະເຊັ່ນ: ລູກສອນ ຫຼື ກ່ອງໂທ.
ເມື່ອແປຈາກອັງກິດເປັນຍີ່ປຸ່ນ, ການປ່ຽນແປງຂອງຄວາມຍາວຂອງຂໍ້ຄວາມສາມາດເຮັດໃຫ້ລູກສອນໂທຊີ້ໄປທີ່ສະຖານທີ່ທີ່ບໍ່ຖືກຕ້ອງ.
ການຍົກຍ້າຍນີ້ເປັນບັນຫາຄວາມປອດໄພທີ່ສໍາຄັນສໍາລັບຄູ່ມືດ້ານວິຊາການ ແລະ نمودົງການແພດບ່ອນທີ່ຄວາມຖືກຕ້ອງບໍ່ສາມາດຕໍ່ລອງໄດ້ສຳລັບຜູ້ໃຊ້.

ການຈັດການຂໍ້ມູນສາຍຕາຢ່າງມີປະສິດທິພາບຮຽກຮ້ອງໃຫ້ມີເຄື່ອງມືຂັ້ນສູງທີ່ສາມາດ <a href=

댓글 남기기

chat