เครื่องแปลงไบนารี ↔ ข้อความ

แปลงข้อความเป็นเลขฐานสองและกลับในเบราว์เซอร์ รองรับ UTF-8 (ภาษาไทยและอีโมจิ) และ ASCII

ตัวอักษร: 3 ไบต์ UTF-8: 9 ความยาวผลลัพธ์: 87
อ้างอิงด่วน: อักขระ ASCII ทั่วไปในไบนารี 8 บิต
อักขระ ฐานสิบ ไบนารี (8 บิต)
A6501000001
Z9001011010
a9701100001
z12201111010
04800110000
95700111001
(ช่องว่าง)3200100000
!3300100001
?6300111111
(ขึ้นบรรทัดใหม่)1000001010

คำถามที่พบบ่อย

การแปลงข้อความเป็นไบนารีทำงานอย่างไร?
อักขระทุกตัวมีรหัสตัวเลขประจำตัว (เรียกว่า code point) สำหรับอักขระ ASCII รหัสจะอยู่ใน 7 บิตและเติม 0 นำหน้าให้ครบ 8 บิต เช่น ตัว A มีรหัส 65 ซึ่งเขียนเป็นไบนารีได้ 01000001 เครื่องมือจะอ่านอักขระทีละตัว ค้นรหัสของมัน แล้วเขียนผลลัพธ์ออกมาทีละไบต์ตามลำดับ
ASCII กับ UTF-8 ต่างกันอย่างไร?
ASCII รองรับเพียง 128 อักขระ (ตัวอักษรอังกฤษ ตัวเลข เครื่องหมายวรรคตอน) ใช้ 1 ไบต์ 7 บิตต่อตัว ส่วน UTF-8 เป็นการเข้ารหัสแบบความยาวแปรผัน รองรับทุกภาษาในโลก ใช้ 1–4 ไบต์ต่ออักขระ อักษรไทยใช้ 3 ไบต์ต่อตัว เช่น = 11100000 10111000 10000001 อีโมจิใช้ 4 ไบต์ ดังนั้นถ้าจะแปลงข้อความไทยต้องเลือก UTF-8 เท่านั้น เพราะ ASCII ไม่ครอบคลุมช่วงรหัส 0E00–0E7F
ทำไมไบนารีของฉันถอดรหัสไม่ได้?
สาเหตุที่พบบ่อย: (1) กลุ่มบิตไม่ครบ 8 (หรือ 7) บิต — ตรวจสอบช่องว่างเกิน; (2) มีอักขระอื่นนอกจาก 0 และ 1 ปนอยู่; (3) ไบนารีเป็นลำดับ UTF-8 ที่ไม่สมบูรณ์ (เช่นต่อ byte ของอักษรไทยขาดไป) เครื่องมือจะแจ้งตำแหน่งกลุ่มแรกที่ผิดเพื่อให้แก้ไขได้ หากข้อมูลไม่มีตัวคั่นเลย ให้ตั้ง "การจัดกลุ่มบิต" เป็น 8 และ "ตัวคั่น" เป็น "ไม่มี"
ควรใช้กี่บิตต่ออักขระ?
มาตรฐานทั่วไปคือ 8 บิตต่อไบต์ ASCII บริสุทธิ์ใช้ 7 บิตก็พอ แต่การจัดเก็บข้อมูลและโพรโทคอลเครือข่ายเติม 0 นำหน้าเป็น 8 บิตเสมอ ใช้ 7 บิตเฉพาะกรณีศึกษาในวิชาวิทยาการคอมพิวเตอร์หรือโพรโทคอล Teletype รุ่นเก่า อักขระนอก ASCII (อักษรไทย จีน อาหรับ อีโมจิ) ต้องใช้ UTF-8 หลายไบต์ จึงไม่สามารถใช้การจัดกลุ่ม 7 บิตได้
แปลงข้อความไทยหรืออีโมจิได้ไหม?
ได้ ขอเพียงตั้งการเข้ารหัสเป็น UTF-8 อักษรไทยทุกตัวใช้ 3 ไบต์ใน UTF-8 เช่น = 11100000 10111000 10000001 และ = 11100000 10111000 10000010 วรรณยุกต์และสระลอย (เช่น ) ก็ใช้ 3 ไบต์เช่นกัน อีโมจิส่วนใหญ่ใช้ 4 ไบต์ ส่วนโหมด ASCII จะปฏิเสธอักขระใดก็ตามที่อยู่นอกช่วง 0–127 พร้อมแจ้งข้อผิดพลาด หากเปิดไฟล์เก่ารหัส TIS-620 แล้วเห็นเป็นภาษาต่างดาว ต้องแปลงเป็น UTF-8 ก่อนใช้งาน
ไบนารีเหมือนภาษาเครื่องไหม?
ไม่เหมือน ไบนารีเป็นเพียงระบบเลขฐาน 2 ที่ใช้สัญลักษณ์ 0 และ 1 ส่วนภาษาเครื่อง (machine code) คือไบนารีที่แทนคำสั่งของซีพียูเฉพาะรุ่น เช่น x86 หรือ ARM ซึ่งมีรูปแบบกำหนดตายตัว ไบนารีที่เห็นในเครื่องมือนี้คือข้อความที่เข้ารหัสเป็นไบต์ ไม่ใช่คำสั่งที่ซีพียูจะเอาไปประมวลผล ทั้งสองอย่างใช้ 0 กับ 1 เหมือนกัน คนทั่วไปจึงเรียกรวมๆ ว่า "ไบนารี"
แปลงไบนารีกลับเป็นข้อความอย่างไร?
เปลี่ยนแท็บไปที่ "ไบนารี → ข้อความ" แล้ววางไบนารีลงในช่อง เครื่องมือจะตัดข้อมูลตามตัวคั่น (ค่าเริ่มต้นคือช่องว่าง) แปลงแต่ละกลุ่มจากเลขฐาน 2 เป็นรหัสฐานสิบ จากนั้นประกอบกลับเป็นข้อความ สำหรับ UTF-8 ระบบจะรวมไบต์ที่ต่อเนื่องกัน (เช่น 3 ไบต์ของอักษรไทย) ให้เป็นอักขระเดียวอย่างถูกต้องโดยอัตโนมัติ
การแปลงทั้งหมดเกิดในเบราว์เซอร์ของคุณ ไม่มีการอัปโหลด

เครื่องมือนี้แปลงข้อความเป็นเลขฐานสอง (ไบนารี) และถอดรหัสไบนารีกลับเป็นข้อความ ทำงานในเบราว์เซอร์ของคุณโดยตรง ไม่มีการอัปโหลดข้อมูลไปเซิร์ฟเวอร์ใด รองรับการเข้ารหัส UTF-8 และ ASCII พร้อมตัวเลือกจัดกลุ่มบิต (7, 8 หรือไม่จัดกลุ่ม) และตัวคั่นที่ปรับได้ (ช่องว่าง ขีดกลาง ขีดตั้ง หรือไม่มี). ข้อสังเกตสำคัญสำหรับผู้ใช้ภาษาไทย: อักษรไทยทุกตัวใช้ 3 ไบต์ใน UTF-8 เช่น ก = 11100000 10111000 10000001 และ ข = 11100000 10111000 10000010 ส่วนอีโมจิใช้ 4 ไบต์ ASCII ไม่รองรับอักษรไทยเพราะครอบคลุมเฉพาะรหัส 0-127. หากเปิดไฟล์เก่ารหัส TIS-620 แล้วเห็นเป็นภาษาต่างดาว ให้แปลงเป็น UTF-8 ก่อน. เหมาะสำหรับนักศึกษาวิทยาการคอมพิวเตอร์ จุฬา มจธ. และผู้สนใจการเข้ารหัสอักขระทั่วไป.