答辩公示

发布日期:2026-05-18 点击:


同济大学外国语学院

博士研究生学位论文答辩公示



孔德璐:

大语言模型时代英汉机器翻译译后编辑语言风格特征模型构建与应用

指导教师:李梅(教授、博导)

答辩组委员:

陶友兰(教授、博导、答辩主席)

余素青(教授、博导)

王华树(教授、博导)

吴贇(教授、博导)

董琇(教授、博导)



2026 520 (周三)19:00答辩秘书:孙萌



地点:腾讯会议(线上)


[主题]: 英语系博士生孔德璐-学位论文答辩会

[会议时间]: 202652019:00 (预留5小时)

[会议号]: 129 476 445

[会议密码]: 739038

[参会链接]: https://meeting.tencent.com/dm/xv3qSQVyKC5t


学位论文简介:

本研究立足于大语言模型(LLM)快速发展的时代背景,聚焦英汉机器翻译译后编辑语言风格特征的系统建模与应用转化。既有研究在研究对象上对英汉方向译文的风格特征考察尚较薄弱,在分析框架上对机器翻译译后编辑文本的多维特征刻画多止步于词汇多样性等少数宏观指标,在应用转化上从特征发现到实践工具的完整链条也几近阙如。为此,本研究以计量文体学作为理论框架,辅之以翻译学理论阐释,遵循“描述统计—模型验证—特征阐释—应用转化”的系统路径,构建多个自建对比语料库,涵盖原创汉语、人工翻译(HT)、机器翻译(MT)、译后编辑(PE)四类文本,机器翻译文本包含神经机器翻译(NMT)与LLM两代引擎,总规模逾百万字符。整合形式化与功能化两个维度、六个层面,共计194维语言特征体系,采用机器学习实验中的分类、聚类、特征筛选算法,构建面向英汉机器翻译译后编辑的数智翻译语言风格特征模型,实现对语言风格特征的识别、阐释以及转化。

核心发现如下:首先,MT译文呈现出兼具跨体裁稳健性与敏感性的“条件性语言变体”结构,被动语态透过、代词冗余与词汇扁平化是跨体裁稳健的底层特征,而逻辑显化程度与审美表现力则随体裁规约的不同而呈现差异。尽管LLM在词汇丰富度与目标语适应性上优于NMT,但其高流畅度也加大了译者识别隐性偏差的认知负荷。其次,实证研究确立了PE作为独立语言变体的地位,其与原创汉语的区分最为准确,与HT的区分难度最大,在词汇、句法与语篇三个维度均呈现阶梯状特征分布。这种由机器认知锚定与译者主体重构共同塑造的居间性混合特征,在技术范式从NMT向LLM转型的背景下进一步演变:翻译编辑率下降,译者操作由被动纠错转向冗余剪枝,信任模式也向接受与微调过渡。这导致大量英语句法框架(如被动语态、长距离依存)及语篇显化标记在PE文本中被不自觉地保留,最终使其在词汇、句法和语篇三个层面均呈现出阶梯状分布规律。最后,研究提出三层递进式应用转化方案,一是探索氛围式翻译模式,将LLM干预从微观纠错前移为宏观风格共创,二是初步构建PE风格指南并转化为结构性提示词。三是研发语言风格特征自动识别系统,以期对不同翻译文本的语言风格特征进行自动化监测与识别。



© 2026 同济大学外国语学院 School of Foreign Studies, Tongji University

中国上海市四平路1239号同济大学汇文楼(200092)