Python打印韩文：从编码到输出的完整指南

引言

在全球化开发环境下，处理多语言文本输出已成为开发者的必备技能。韩文作为东亚重要语言，其编码和显示问题常常困扰初学者。本文将系统讲解Python中打印韩文的完整流程，包括环境配置、编码处理、常见错误及解决方案。

一、韩文编码基础

1.1 Unicode与韩文字符

韩文字符采用Unicode编码，主要位于以下范围：

韩文音节（Hangul Syllables）：U+AC00 - U+D7AF
韩文字母（Hangul Jamo）：U+1100 - U+11FF
韩文兼容字母：U+3130 - U+318F

每个韩文字符通常由2-3个Jamo字符组合而成，这种组合特性在处理时需要特别注意。

1.2 编码格式选择

推荐使用UTF-8编码，其优势包括：

兼容ASCII字符
变量长度（1-4字节）节省空间
广泛支持各种韩文字符
与Python3默认字符串编码一致

二、Python环境配置

2.1 终端编码设置

在Linux/macOS终端中，需确保：

# 检查当前locale设置
locale
# 应包含UTF-8支持，如：
# LANG="en_US.UTF-8"
# LC_CTYPE="en_US.UTF-8"
# 若未设置，可临时修改
export LANG="ko_KR.UTF-8"
export LC_ALL="ko_KR.UTF-8"

Windows系统需在控制面板的”区域和语言”设置中添加韩语支持，并在CMD中执行：

chcp 65001  # 设置为UTF-8代码页

2.2 IDE编码配置

主流IDE的编码设置：

PyCharm：File → Settings → Editor → File Encodings → 全局和项目编码设为UTF-8
VSCode：右下角点击编码按钮 → 选择”通过编码保存” → UTF-8
Jupyter Notebook：启动时添加--NotebookApp.iopub_data_rate_limit=1e10参数防止大文本截断

三、Python代码实现

3.1 基本打印方法

# 直接打印韩文字符串
print("안녕하세요")  # 韩语"你好"
print("대한민국")    # 韩语"大韩民国"
# 多行字符串
korean_text = """
가나다라마바사아자차카타파하
한국어를 출력합니다.
"""
print(korean_text)

3.2 变量中的韩文处理

name = "이순신"  # 韩文姓名
greeting = f"{name}님, 환영합니다!"  # f-string格式化
print(greeting)
# 列表中的韩文元素
fruits = ["사과", "바나나", "딸기"]
for fruit in fruits:
    print(fruit)

3.3 文件读写操作

# 写入韩文到文件
with open("korean.txt", "w", encoding="utf-8") as f:
    f.write("파일에 한글을 씁니다.\n두번째 줄입니다.")
# 读取韩文文件
with open("korean.txt", "r", encoding="utf-8") as f:
    content = f.read()
    print(content)

四、常见问题解决方案

4.1 乱码问题

现象：打印出□□□或问号
原因：

终端/IDE不支持UTF-8
文件读写未指定编码
字符串被错误转码

解决方案：

# 强制编码转换示例（不推荐，优先解决环境问题）
text = "한글".encode('utf-8').decode('utf-8')  # 确保正确编码
# 正确做法：统一使用UTF-8
import sys
reload(sys)  # Python2需要（不推荐使用Python2）
sys.setdefaultencoding('utf-8')  # Python2的临时解决方案

4.2 字体显示问题

现象：字符显示为方框或空白
解决方案：

Windows：安装”Malgun Gothic”等韩文字体

Linux：安装fonts-nanum包

# Ubuntu/Debian
sudo apt-get install fonts-nanum

4.3 数据库存储问题

MySQL示例：

import pymysql
conn = pymysql.connect(
    host='localhost',
    user='user',
    password='pass',
    database='test',
    charset='utf8mb4'  # 必须使用utf8mb4而非utf8
)
cursor = conn.cursor()
cursor.execute("INSERT INTO korean_table VALUES ('한글 데이터')")
conn.commit()

五、高级应用技巧

5.1 韩文正则表达式

import re
# 匹配韩文字符
pattern = re.compile(r'[\uAC00-\uD7AF\u1100-\u11FF\u3130-\u318F]+')
text = "English와 한국어 混合"
matches = pattern.findall(text)
print(matches)  # 输出: ['한국어']

5.2 韩文文本处理库

# 使用hangul-utils处理韩文字母
from hangul_utils import split_syllable_chars
text = "한글"
chars = split_syllable_chars(text)
print(chars)  # 输出: ['ㅎ', 'ㅏ', 'ㄴ', 'ㄱ', 'ㅡ', 'ㄹ']

5.3 跨平台兼容性处理

import sys
import locale
def get_preferred_encoding():
    try:
        return locale.getpreferredencoding()
    except:
        return 'utf-8'
def safe_print(text):
    encoding = get_preferred_encoding()
    try:
        print(text.encode(encoding, errors='replace').decode(encoding))
    except Exception as e:
        print(f"打印错误: {e}")
        print(text.encode('utf-8').decode('ascii', errors='replace'))
# 使用示例
safe_print("복잡한 한글 텍스트 테스트")

六、最佳实践建议

始终显式指定编码：在文件操作、数据库连接等场景明确指定UTF-8
开发环境标准化：团队统一使用UTF-8编码的IDE和终端
测试覆盖：包含韩文字符的单元测试和集成测试
错误处理：捕获并妥善处理UnicodeDecodeError等异常
文档注释：在代码中添加韩文相关的注释说明

七、扩展资源

Unicode韩文字符表：Unicode Hangul Syllables
Python编码文档：Python Unicode HOWTO
韩文处理库：
- hangul-utils: https://pypi.org/project/hangul-utils/
- PyHangul: https://github.com/hive01/pyhangul

结论

通过系统配置编码环境、正确处理字符串编码、妥善解决常见问题，开发者可以轻松在Python中实现韩文的打印和输出。掌握这些技能不仅有助于开发国际化应用，也能提升处理多语言数据的能力。建议开发者在实际项目中多加练习，逐步积累跨语言文本处理的经验。

Python实现韩文打印：从编码到输出的完整指南