Python中实现韩文打印的完整指南

一、韩文字符编码基础

韩文字符采用Unicode编码标准，具体使用UTF-8编码方案。每个韩文字符在UTF-8中占用3个字节，例如”안”的Unicode编码为U+AC00，二进制表示为11101010 10110000 10000000。理解这一编码机制是正确处理韩文的基础。

Python3默认使用UTF-8编码处理字符串，这为韩文处理提供了天然支持。但开发者仍需注意以下编码场景：

文件读写时的编码声明
网络传输时的编码转换
数据库存储时的编码配置

二、基础打印实现

1. 控制台直接打印

print("안녕하세요")  # 韩语"你好"
print("한국어 출력 테스트")  # 韩语"韩文打印测试"

当终端支持UTF-8时，上述代码可直接显示韩文。若出现乱码，需检查：

终端编码设置（Linux: locale, Windows: 控制面板区域设置）
IDE编码配置（PyCharm/VSCode需设置为UTF-8）

2. 文件写入与读取

# 写入韩文文件
with open('korean.txt', 'w', encoding='utf-8') as f:
    f.write("파이썬으로 한글 출력하기\n")  # "用Python打印韩文"
# 读取韩文文件
with open('korean.txt', 'r', encoding='utf-8') as f:
    content = f.read()
    print(content)

关键点：

必须显式指定encoding='utf-8'
文件编辑器保存时也需选择UTF-8编码

三、高级应用场景

1. 多语言混合处理

def print_multilingual(texts):
    for lang, text in texts.items():
        print(f"{lang}: {text}")
texts = {
    "English": "Hello",
    "한국어": "안녕",
    "中文": "你好"
}
print_multilingual(texts)

2. 格式化字符串中的韩文

name = "김선우"
age = 25
print(f"{name}님은 {age}살입니다.")  # "金善宇先生25岁"

3. 韩文字符串操作

# 字符串长度（按字符计）
text = "대한민국"
print(len(text))  # 输出4（不是字节数）
# 字符遍历
for char in text:
    print(char)
# 子串查找
if "한국" in text:
    print("包含'韩国'相关词汇")

四、常见问题解决方案

1. 终端显示乱码

Linux/Mac解决方案：

# 检查当前locale
locale
# 修改为UTF-8环境（临时）
export LANG=en_US.UTF-8
export LC_ALL=en_US.UTF-8
# 永久修改需编辑~/.bashrc或~/.bash_profile

Windows解决方案：

控制面板 → 区域 → 管理 → 更改系统区域设置
勾选”Beta: 使用Unicode UTF-8提供全球语言支持”

2. 文件读写错误

try:
    with open('korean.txt', 'r', encoding='utf-8') as f:
        print(f.read())
except UnicodeDecodeError:
    print("文件编码不是UTF-8，请重新保存为UTF-8格式")
except FileNotFoundError:
    print("文件不存在")

3. 数据库存储问题

MySQL配置示例：

-- 创建数据库时指定编码
CREATE DATABASE korean_db 
CHARACTER SET utf8mb4 
COLLATE utf8mb4_unicode_ci;
-- 连接时指定编码（Python连接字符串）
# "mysql+pymysql://user:pass@localhost/korean_db?charset=utf8mb4"

五、最佳实践建议

始终显式声明编码：在文件操作、数据库连接等场景明确指定UTF-8
使用UTF-8 with BOM：Windows环境下处理文本文件时，可考虑使用带BOM的UTF-8
字体支持检查：确保系统安装了支持韩文的字体（如Gulim、Malgun Gothic）
跨平台测试：在目标运行环境测试韩文显示效果

使用unicodedata模块：

import unicodedata
char = "한"
print(unicodedata.name(char))  # 输出"HANGUL SYLLABLE HAN"

六、扩展应用

1. 韩文拼音转换

# 需要安装hangul-romanize库
# pip install hangul-romanize
from hangul_romanize.romanize import romanize
print(romanize("한국어"))  # 输出"hangeugeo"

2. 韩文字符统计

def count_jamo(text):
    """统计初声/中声/终声数量"""
    initial = set()
    vowel = set()
    final = set()
    for char in text:
        # 这里简化处理，实际需要完整的韩文字符分解
        if u'\uAC00' <= char <= u'\uD7A3':  # 韩文范围
            # 实际分解需要更复杂的逻辑
            pass
    return len(initial), len(vowel), len(final)

七、性能考虑

当处理大量韩文文本时：

使用str.encode()和bytes.decode()进行批量转换
考虑使用内存映射文件处理超大韩文文本
对于搜索应用，建立韩文索引时注意归一化处理（如组合音节分解）

# 大文件处理示例
def process_large_korean_file(file_path):
    chunk_size = 1024 * 1024  # 1MB
    with open(file_path, 'r', encoding='utf-8') as f:
        while True:
            chunk = f.read(chunk_size)
            if not chunk:
                break
            # 处理每个chunk
            print(f"处理了{len(chunk)}字节的韩文数据")

通过以上方法，开发者可以全面掌握Python中韩文打印的各种场景，从基础显示到高级处理都能得心应手。实际应用中，结合具体需求选择合适的方法，并始终注意编码一致性，即可避免大多数韩文处理问题。