HI,欢迎来到学术之家股权代码  102064
0
首页 精品范文 计算机毕业论文设计

计算机毕业论文设计

时间:2023-05-29 17:45:13

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇计算机毕业论文设计,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

计算机毕业论文设计

第1篇

一、选题

1、选题未通过者,可参照已过学生的课题进行修改(只能做参照,不得出现重复)。工科毕业设计要有具体的解决内容及相关解决方案,不要求多高深,但求实在。

2、选题需要修改者,切记论文课题不要是文科或科普性(如计算机发展史、浅谈××、浅析××等),也不要太大或者太泛泛(如网络信息安全与防范、网络信息安全的技术探讨等)。建议题目格式为“基于××技术的××系统设计与开发”。

二、摘要

1、论文摘要一定要根据论文课题内容围绕展开,需要提出问题及解决成果,研究手段、方法、过程等可不阐述。

2、论文摘要要写得高度概括、简略,不要写论文选题的缘由。

三、正文

1、选题及论文摘要通过者可直接撰写论文正文;选题及论文摘要未通过者,先进行修改后方可再撰写。切记不要像文科作文一样泛泛而谈,一定要有问题的提出,相关技术介绍,系统设计,详细设计以及最后的成果。

2、论文严禁抄袭,避免“复制+粘贴”行为。我们会用专门的软件进行,重复率高于20%的一律视为不合格。

3、论文正文不少于6000字,必须严格按照模板格式要求,注意字体、行间距、图表、页眉页脚、排版等。

4、务必在3月5日前完成毕业论文正文初稿,论文指导老师会通过“毕业论文设计平台”线上对毕业论文作出修改要求,同学们必须时刻关注,进行修改。

第2篇

1.论文类型:

不同的院系,不同的指导教师对本科毕业论文有不同的指导方法,在计算机系,本科毕业论文通常以下面四种类型:

1.1完成一个不太大的实际项目或在某一个较大的项目中设计并完成一个模块(如应用软件、工具软件或自行设计的板卡、接口等等),然后以工程项目总结或科研报告、或已发表的论文的综合扩展等形式完成论文。

1.2对一个即将进行的项目的一部份进行系统分析(需求分析,平台选型,分块,设计部分模块的细化)。例如对一个大中型企业管理信息系统中的财务部分进行调研,分析和设计等,这类工作可以没有具体编程,但应得到有关方面的初步认可,有一定的工作量。例如打印后有30页以上的报告。

1.3对某一项计算机领域的先进技术或成熟软件进行分析、比较,进而能提出自己的评价和有针对性创见。例如XML目前是因特网上新涌现的标记语言,它较HTML有许多无可比拟的优点,其中XML-QL是基于XML提出的一种新型查询语言,分析总结这一新型查询语言并探索它的实现途径是十分有意义的工作。再如对自由软件数据库系统MySQL,分析总结其在Web应用上的特色,并能将有关技术用于自己研制的系统中。这类工作要注意把分析和实验相结合,不要只停留在消化上。消化是前提,吸收和转化才是工作的重点。

1.4对某一个计算机科学中的理论问题有一定见解,接近或达到了在杂志上发表的水平。例如,解决了一个众所周知的问题,纠正了某杂志上理论的错误且提出解决修正方案,或自己提出有意义的模型,定义,且有定理、命题、或性能比较、分析、测试报告等。

一般而言,第四种较难,在若干年指导本科生毕业论文经验中,只有两位学生采用此形式写出了好的论文,据悉,这两位学生都顺利进入了博士生序列。

2.选题:

2.1有科研项目的老师通常愿意从项目中选取本科生能完成的模块,交给学生做,然后以第一种形式写成论文。教师熟悉项目,项目有实用背景,一般而言,多数学生经过努力都能完成。但有些科研项目太难,或涉及保密内容,或本科生不容易完成,在这种情况下,教师可能会让已保送为研究生,或确定留校的学生作这类题目。

2.2学生自选题目,有些学生已联系好毕业后的工作单位,工作单位要求学生作某方面的项目,或已交给学生某方面的项目,经过指导教师认可,认为可作出合格的毕业论文,则可作这方面题目。这种方式下,学生积极性高,责任心较强,学以致用,一般论文的质量较好且成文后篇幅较大。

2.3教师根据社会需求,选择题目。例如,院系行政需要教学,科研和研究生信息管理系统,有的教师指导几位学生分别作大学院系行政管理子系统,博士生硕士生学籍管理子系统等等,有可能开始作出的软件还不很完善,但有了雏形,经过修改后,一般是能够应用的。有的系统经过下一届本科生毕业实习的改进,就可以实用了。一些对路的、有用户的软件还有可能进一步发展为产品

3.论文的组织安排:

依据上述的论文类型,由于各类工作特点的不同,在搜集整理论文的素材、组织安排论文的结构方面,应有所不同,做到有的放矢。

3.1系统实现型论文:重点收集整理系统体系结构,程序模块调用关系,数据结构,算法,实验或测试等内容,论文结构一般安排如下:

(1)引言或背景(概述题目背景,实现情况,自己开发的内容或模块)一般谈课题意义,综述已有成果,如”谁谁在文献某某中做了什么工作,谁谁在文献某某中有什么突出贡献“,用“但是”一转,分析存在问题,引出自己工作必要性、意义和价值、创新点和主要思想、方法和结果。然后用“本文组织如下:第二节第三节....,第四节....."作为这段结束。

(2)系统体系结构(强调系统的整体性,突出自己工作在整体中的位置)。(3)主要实现功能的描述(包括模块调用关系,数据结构,算法说明,依据内容多少此部分可安排两到三节)。

(4)实验或测试。

(5)总结。

3.2应用开发型论文:

重点收集整理应用项目的背景分析,需求分析,平台选型,分块,设计部分模块的细化,使用的开发工具的内容。论文结构一般安排如下:(1)引言(重点描述应用项目背景,项目开发特色,工作难度等);

(2)项目分析设计(重点描述项目的整体框架,功能说明,开发工具简介等)(3)项目实现(重点描述数据库设计结果,代码开发原理和过程,实现中遇到和解决的主要问题,项目今后的维护和改进等,此部分可安排两到三节);

(4)总结。

3.3分析比较型论文:

重点收集整理有关的最新论文或软件,分析比较心得,实验数据等内容。论文结构一般安排如下:引言(重点描述分析对象的特点,分析比较工作的意义,主要结果等);分析对象的概括性描述,分析比较的主要结果(如果是技术分析,给出主要数据,如果是软件分析,给出代码分析结果,实验过程等);分析比较的评价和系统应用(可以给出基于分析比较的结果,提出某些设计实现方案,和进行一些实验工作;最后是结论。

3.4理论探索型论文:

重点收集整理问题的发现,解决问题所用到的基本知识,解决问题的独特方法,定理证明,算法设计和分析。

论文结构一般安排如下:

(1)引言(重点描述要解决的问题的来源,难度,解决问题的主要方法等);

(2)基本知识(解决问题涉及的基本定义,定理,及自己提出的概念等);

(3)推理结论(给出问题解决方案,包括定理证明,算法设计,复杂性分析等);

(4)结论。上述论文结构的安排和划分不是绝对,可依据各自工作的实际情况,采用某一种或某几种混合的方式指导自己论文的写作。但无论采用什么样的结构,一定要作到心中有数,贯穿一条逻辑线索切不可泛论成文或堆砌成文,时刻突出自己的工作内容。

4.论文格式及目录系统:

每个作者有自己的风格,格式不必强求一致,但科技论文不能象写小说剧本那样,一般不能用倒叙,插叙,不设悬念,不用意识流,多线索方式等。例如,可在下列格式基础上适当修改:科技论文目录体系一般不用中文的“一二三”,而用下列的编排方式题目扉页|___摘要(中英文,200-300字为限)|___正文目录1.前言(背景,动机,前人工作)|___1.1。。。。|(1)(a)(b)(c)|(2)(a)(b)(c)|___1.2。。。。2.项目框图及本工作在项目中的地位

3.项目特色(特殊功能,困难

4.方案选择(前人方案,现可选方案,为什么选这一方案)

5.实现技术数据结构程序片段:

6.特殊问题解决方法:

|__6.1问题1|__6.2问题2|__......

第3篇

网络营销是一种以消费者为导向,强调个人化的营销方式

网络营销最大的特点在于以消费者为主导。消费者将拥有比过去更大的选择自由,他们可根据自己的个性特点和需求在全球范围内寻找满足品,不受地域限制。通过进入感兴趣的的企业网址或虚拟商店,消费者可获取产品的更多的相关信息,使购物更显个性。

这种个性消费的发展将促使企业重新考虑其营销战略以消费者的个性需求作为提品及服务的出发点。但是,要真正实现个性营销还必须解决庞大的促销费用问题。网络营销的出现则为这一难题提供了可行的解决途径。企业的各种销售信息在网络上将以数字化的形式存在,可以以极底的成本发送并能随时根据需要进行修改,庞大的促销费用因而得以节省。企业也可以根据消费者反馈的信息和要求通过自动服务系统提供特别服务。

网络营销具有极强的互动性是实现全程营销的理想工具

传统的传统的营销管理强调4P(产品、价格、渠道和促销)组合,现代营销管理则追求4C(顾客、成本、方便和沟通),然而无论那一种观念都必须基于这样一个前提:企业必须实行全程营销,即必须由产品的设计阶段开始就充分考虑消费者的需求和意愿。

遗憾的是,在实际操作中这一点往往难以做到。原因在于消费者与企业之间缺乏合适的沟通渠道或沟通成本太高。消费者一般只能针对现有产品提出建议或批评,对尚处于概念阶段的产品难以涉足。此外,大多数的中小企业也缺乏足够的资本用于了解消费者的各种潜在需求,他们只能凭自身能力或参照市场领导者的策略进行产品开发。

而在网络环境下,这一状况将有所改观。即使是中小企业也可以通过电子布告栏、线上讨论广场和电子邮件等方式,以极底成本在营销的全过程中对消费者进行即时的信息搜索,消费者则有机会对产品从设计到定价(对采用理解价值定价法的企业尤为重要)和服务等一系列问题发表意见。这种双向互动的沟通方式提高了消费者的参与性与积极性,更重要的是它能使、企业的决策有的放矢,从根本上提高消费者满意度。

网络营销能满足消费者对购物方便性的需求,提高消费者的购物效率

现代化的生活节奏已使消费者用于外出在商店购物的时间越来越短。在传统的购物方式中,从商品买卖过程来看,一般需要经过看样棗选择商品棗确定所需购买的商品棗付款结算棗包装商品棗取货(或送货)等一系列过程。这个买卖过程大多数是在售货地点完成的,短则几分钟,长则数个小时,在加上购买为购买商品去购物场所的路途时间、购买后的返途时间及在购买地的逗留时间,无疑是大大延长了商品的买卖过程,使消费者为购买商品而在时间和精力上作出很大的付出。同时,拥挤的交通和日益扩大的店面更延长了消费者购物所耗费的时间和精力。然而,在现代社会,随着生活节奏的加快,使得人们越来越珍惜闲暇时间,越来越希望在闲暇时间内从事一些有益于身心的活动,并充分地享受生活。在这中情况下,人们用于外出购物的时间越来越少。

第4篇

国际互联网络的产生和迅速普及已成为人类社会迸人信息时代的重要标志。如果说单台计算机相对于人类的关系还仅限于工具的角色,那么,网络化后的计算机系统则已成为人类社会生活不可或缺的有机组成部分。当越来越多的人借助于计算机而进入这个网络时,这个无形的网络也就把所有进人网络的人们联系在了一起,从而建立了一种人与人之间的新型关系。网络世界的出现所带来的不仅仅是信息处理与传输技术的革命,其更深远意义和影响还在于它已经或者正在引起整个社会组织架构及其制度安排的深刻变革。而这种变革必将引起作为企业管理信息系统组成部分的会计信息系统的一场革命。会计领域之内和之外的许多人都多多少少地感觉到了这场革命,但对于这场变革的方向、形式和未来前景却是仁者见仁、智者见智。本文拟就此阐述作者自古的见解,权作抛砖引玉。

一、制造业企业生产与管理的沿革

在工业社会乃至以前的社会申,会计信息系统可以说是企业最主要甚至是唯一的信息系统。它的这种唯一性决定了它在企业组织管理架构中的相对独立性和封闭性。作为一个相对独立和封闭的系统,在过去500余年的发展历程中,它逐步积累和形成了一套相对完善和成型的财务信息''''处理程序和方法体系。以电子计算机的发明为起点的现代信息技术的诞生,改变了会计系统用以处理信息的工具纸张、笔墨和算盘,但并未触及会计信息处理的程序、方法和规则的变革。然而,以互联网络技术为代表的现代信息传输技术的革命,在客观上便提出了实现企业信息集成的要求。这种信息集成,一方面有赖于网络通讯技术自身的发展,另一方面也取决于企业其他生产与管理领域的自动化或信息化程度。。在过去100年的发展历程中,人类在这两个领域都已取得了巨大的成就。

就制造业企业而言,人类不断解放自身劳动的过程,也是一个不断实现生产和管理自动化的过程。手工业时代的产品,是由生产工人亲手做出来的,我们称之为手工产品或手工艺品。工业革命把人类从手工劳动中解放出来,产品不再是由手工而是由机器来生产。工人只需要站在机器旁边,产品的加工制造便可以由机器来完成,我们称这类生产为机械化生产。由机器而不是手工生产出来的产品,我们称之为工业产品。计算机数字控制机床的出现和使用,第一次引入了生产自动化的概念。它不仅使得产品的生产过程变得更为简单和更容易控制,而且也使得产品的加工可以比机械化生产更为复杂和精确。但这时的自动化还仅限于单台的机器而不涉及企业的整个生产过程,所以,我们称这类生产为半自动化生产。数控机床和机器人技术的合并使用开始使得企业生产过程变得无人化,而网络技术在企业生产卢管理领域的广泛渗锈,则把企业的各个部分都集感为一个相互联系的整体,从而使得企业的许多甚至全部生产与管理工作都可以在完全无人工介人的情况下完成,我们可以称这类生产为智能化生产。在智能化生产的环境中,产品几乎完全是由智能化的机器生产出来的,不仅生产工人已勿需站在机器旁边,而且,从理论上说,整个企业都可以实现无人化,尽管我们现在还不知道应当怎样来描述这类产品,但也许只有"知识产品"的称谓最合适,因为它是用人类既有的知识而不是劳动生产出来的产品,是用人类已创造的科学技术成果生产出来的产品。

由于企业生产和管理的自动化或智能化能够带给企业更多的生产成本节约和更高的顾客满意度,所以,它便成为追求利润最大化的企业所追求的目标。而企业生产与管理的不断自动化或信息化,难以避免地把企业的各种生产与管理活动集成在一起,通过信息这个神经系统来配置企业的所有资源(不仅仅是财务资源)和协调企业各个方面的作业。因此,在这一环境下所构造的会计信息系统已不可能再是孤立的、封闭的信息系统。

二、会计信息系统在计算机集成制造(CIM)环境中的地位

计算机集成制造(ComputerIntergratedmanufacturing)是现阶段企业生产与管理自动化(或信息化)的一个基本框架。它通常由四个部分的信息系统组成:"计算机辅助设计(Computeraideddesign,简称CAD)、,计算机辅助制造(computer-aidedManufacturing,,简称CAM)、制造资源计划(ManufacturingResourcesPlanning,简称MRPII)、和电子数据互换(ElectronicDataInterchange,简称EDI)。其中,CAD和CAM技术也许更多的是侧重于企业的生产技术方面,而MPPII和EDI技术则更多的涉及到企业的管理领域。

(l)CAD系统。CAD系统可以说是产品设计发展史上的广次革命。这一技术最初只是

何于60年代早期的航空工业,但随后便迅速扩展至其他工业领域,并且进一步向新产品制造过程的设计与评价领域延伸,从而导致了工作过程和步骤的具体化。高级的CAD系统可以同时用于设计产品和程序。"经理人员"借助干CAD系统,可以评价产品的技术可行性并进而确定"制造可行性"。由于CAD技术有效地缩短了产品设计时间,从而使企业能够迅速对市场化作出反应,并且能够根据客户的特殊需要,量身定做。当CAD系统与外部通讯网络(EDI)连通时,生产企业便可与其供应商和客户分享其具体的产品设计方案。

(2)CAM系统。CAM系统主要用于监督和控制生产工艺过程。它通过程序控制、数字控制和机器人装备的使用,实现生产工艺过程的无人化。信息技术时代以前的企业自动化,通常所寻求的目标只是采用具有通用目的的机床,如钻床、车床、刨床等,旨在能够有效地提高工力的劳动效率;而如今的CAM技术则是通过对整个生产过程的控制,不仅使产品的实物生产程序变得更为精确、高速和控制。而且还可以通过自动化完全取代人类的劳动。

(3)MRP和MRPII系统。MRP也称原材料需求计划(Materialrequirementsplanning)或物料管理系统。其功能包括探索单个的工作定单以形成二个BOM,然后提前确定存货需求。其目的旨在缩小批量生产时的存货占用量。而MRPII不仅仅局限于存货管理,而是将好几种甚至企业所有的商业活动集成在一个系统内,所以,它也可称之为壬种再工程技术(ReengineeirngTechique)或再造技术。它是协调整个企业活动的一个系统或者更确切地说是一种理念,一种哲学。该系统包括执行生产计划,提供反馈和控制的全过程。

MRPII将自动为所要生产的产品产生材料定单、同时把产品的生产安排到主要生产计划中,并根据机器和劳动力情况形成一个粗略的生产能力计划;然后根据适时制(JIT)标准,自动生成包括原材料供应时间表在内的材料需求计划,为工厂设计最终的生产能力计划,管理原材料和产成品等存货。MRPII集产品设计、按顺序进入的工厂生产程序、会计信息、ABC成本系统于一体,从而使得能够在控制成本和保持尽可能低的存货水平的同时,建立、沟通和有效地执行生产计划。当MRPII与外部网络技术联系在一起时,企业便可自动地收到销货定单和现金收入,自动发送购货定单并向供应商付款,以及收发相关的运输凭证等。(4)EDI系统。很多公司为协调销售和生产经营并保持原材料流动的不间断,通常都会与其顾客和供应商签定贸易伙伴关系协议。通过这些协议,公司便为再造商业程序或使其完全

自动化处理奠定了基础。这种完全自动化的商业程序通常是借助于被称为电子数据互换(EDI)的系统来实现的。它通常的定义是:计算机可处理商业信息按标准格式在公司间的交换。从定义中我们可以发现:第一,EDI是一种公司间相互努力的结果,一家单个的公司是不

可能自己使用EDI技术的。第二,交易是由贸易伙伴的信息系统自动处理的。在一个纯粹的EDI环境中,完全不需要人的介人去授权或批准交易的发生。第三,交易信息是以标准格式传送的。所以,企业内部各种不同的系统都可进行接口并执行交易。

EDI系统的关键点主要在于EDI标准,也就是以标准的格式传递信号。EDI技术在过去的发展之所以显得比较缓慢,最根本的原因在于缺乏一个单一的标准体系。目前在国际范围内普遍流行的标准主要有两个:一个是美国国家标准协会的(AmericanNationalStandardInstitut)ANSIX.I2;另一个是行管、商业和交通系统通用的EDIFACT(EDIforAdministration,CommerceAndTransport)。

就目前的发展而论,EDI技术在处理购销货定单方面可以说已表现得非常成功,但在收付款项方面还略显不足。原因之一在于企业的收付款项需要借助于银行这个中介来完成。由于在购货与销货过程中因产品质量、运输毁损等多方面的原因可能使收款额度与付款额度之间出现差异,"而要转换有关付款的解释通常会导致大量的记录产生,目前有关E由标准还不能很好的解决这一问题,所以,这在二定程度上影响了EDI技术在电子钱款转移EFT,ElectronicFundsTransfer)方面的广泛应用。通过上述对彷M系统的描述,我们大致可以勾勒出如下三个初步印象:

第一,现代信息技术的发展在硬件和软件两个方面已经可以使一个企业实现拿自动化的生产和经营,也就是产生真正意义上的无人工厂。所不足的虐,无人工厂的存在不仅取决于单个企业自身,还取决于企业运作的整个外部环境,也就是说,无人工厂还难以在周边企业尚未实现无人化的情形下单独存在。但除EDI系统之外的其他几个子系统在企业中的运用则可以不受周边环境的影响。

第二,全自动化工厂或无人工厂是一个实现了高度计划化的工厂。当一个又一个企业实现了高度计划化以后,整个社会的经济运作也就自然而然的形成高度计划化。在这个意义上说,计划经济并不是一个毫无可取之处的经济制度安排。但它实现的前提必须是以强大的信息系统作支撑。我们以前的计划经济在某种程度上之所以说是失败,关键就在于我们缺乏一个强有力的信息系统,从而使计划经济制度的优点受到局限,而其缺陷和漏洞却暴露无遗。我们有理由相信,随着信息技术的不断发展与完善,企业的自动化程度也会越来越高,社会资源的计划配置方式也会越来越显示出它的优越性。这在一定程度上支持了马克思早在100年以前的预见。

第三,信息时代的到来为中国的繁荣富强再次提供了不可多得的历史性机遇。因为在很多信息技术的利用和发展方面,西方发达国家与我们几乎又站在了同一起跑线。相对于其他领域的技术差距而言/信息技术在目前是最没有差距或差距最小的一个领域。

三、网络时代的财务与会计变革

计算机集成制造不仅使企业生产领域里的分工开始失去其严格的界限,而且也使管理领域的分工开始变得模糊起来。由此可见,网络化虽然不是使个体失去个性化的特点,但个性化的特点却只有借助于与整个网络的协调才能够体现。因此,如上所述的计算机集成制造绝对不仅仅只是一个自动化的概念;它对企业商业活动的组织;职能机构的设置、各部门、岗位的人员配置与职责分工无疑都已产生革命性的影响。没有适应高度信息化或网络化要求的革命性变革,就不可能赢得网络时代的竞争优势。

第5篇

1.引言

当电子计算机1946年问世的时候,人们就提出了机器翻译的想法,并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用(语言信息检索、文本自动分类、自动文摘、信息提取等等)相比,机器翻译却是进展最慢的。学者们倾其大半生精力、商家投入为数可观的资金,经历五十多年不懈的研究和开发,得到的成果或者产品却常常不能令人满意。

原因是什么呢?从语言研究的角度来说,机器翻译系统分析、理解和生成自然语言的能力都还不到位,处理不了的语言现象很多:有的是句子结构层次弄错了,有的是结构关系弄错了,有的是成分之间的语义关系弄错了,有的是词义辨识错了,还有的错误是源语和目标语之间的对比差异造成的。下面是机器翻译处理汉语动结式不成功的几个例子(来自三个机器翻译系统)。

先看生成的情况,机器翻译目前还很难生成汉语的动结式,所以我们很少在汉语译文里见到含有动结式的句子。对于下面这个英译汉的例子,三个系统都不能翻译成“他把地扫干净了”:

Hesweptthefloorclean.

*他干净地扫地了。

*他清扫清洁的地板。

*他清扫地板干净。

再看汉语动结式翻译成英语的例子,它们可以说明目前机器翻译系统分析和理解汉语动结式的能力:

他踢坏了三双鞋。*Heplaysthreepairsofevilshoes.

*Hekickedthreepairsofshoesbad.

*Himkickspoil3pairsofshoes.

这段路把妈妈走累了。*Thewaymakemothertiredafterthewalk.

*Thissectionofwaywaswalkedmothertired(ly).

*Thisroadmotherwalktired.

大家吃腻了剩菜。*Everybodyhasfeddedupwiththeleftovers.

*Thateverybodyategreasy(ly)surplusvegetable.

*Alleat,isloathetoleavevegetable.

下面我们只讨论动结式的生成问题,其中不包括以下三种情况:1)补语用“得”字连接的;2)补语虚化的,如:“抓住”、“买着”、“看完”、“办成”等;3)补语和动结式的宾语有固定搭配关系的,如:“说走了板”、“看愣了神”、“苦出了头”等等。

2.机器翻译中的动结式问题

为了说明机器翻译如何处理动结式述语结构,我们需要先看看机器翻译的过程。下图说明了机器翻译的原理,也是机器翻译的整个过程。

附图

图1机器翻译的过程

显然,这是一个理想化的机器翻译过程。从S到I再到T的过程是中介语言的翻译策略,中介语言通常是某种独立于源语和目标语的逻辑表达式。如果是英译汉,对英语的分析和理解要从表层深入到底层,得到描述句子意义的中介语言逻辑表达式。同样地,汉语也要从底层到表层一步一步生成。分析时从表层到底层走得越深,生成时从底层回到表层的过程也就越复杂。因此,需要分别对这两种语言的句法和语义系统作深入的研究。实际上目前大部分机器翻译系统都作不到这个程度,常见的翻译策略是直接法或转换法,或直接和转换相结合的混合方法。我们可以通过一个英译汉的例子对直接法、转换法和中介语言法这三种翻译策略作一个比较:

Yougetgoodreceptiononyourradio.(摘自某产品说明书)

译句1你得到好的接收在你的收音机上。

译句2你用你的收音机得到好的接收。

译句3你的收音机接收情况良好。

在机器翻译系统中,用直接法可以得到译句1;用基于句法的转换法,再加上一些语义关系的分析,能得到译句2;译句3是基于理解的,用中介语言法有可能作到。显然,前一节关于动结式英译汉和汉译英的例子,都不是基于理解的翻译。

动结式的结构形式简洁,语义关系复杂,在汉语里是很有特点的一种结构。吕叔湘先生(1986)曾用它说明汉语句法的灵活性。人们在从各种角度论述动结式述补结构的时候,常常会提到它在对外汉语教学当中是个难点。同样,在机器翻译中它也是个难题。在汉语翻译成外语的系统里,难的是如何分析和理解动结式述补结构。在外语翻译成汉语的系统里,难的是如何生成含有动结式的句子。

我们在这里只讨论生成的情况。在这种情况下,源语(例如英语)往往没有相当于汉语动结式的结构形式,也很难用转换规则把英语的某些结构形式与汉语动结式联系起来。所以除非用个别处理的办法,采用直接法和转换法翻译策略的系统很难生成汉语的动结式译文。要让系统有生成动结式的能力,就要按中介语言法的思路,增加分析的深度,理解源语句子要表达的意思(各个成分的概念意义、成分之间的关系意义,句子的句式意义,等等),然后根据意义表达的需要,选择动结式的一种结构形式,再生成表层的句子。目前我们对汉语的研究还不足以支持这样的生成过程。所以在现有的机器翻译系统输出的汉语译文当中,很难找到地道的含有动结式述补结构的句子。于是就有了下面的译文:

Hehasmadethequestioncomplicated.他已使问题复杂化。(他把问题搞复杂了。)

Thechildrenhavehadenoughtoeat.孩子们已吃了足够。(孩子们吃饱了。)

这样的译文对机器翻译来说就算不错了,只是念起来有些别扭,有点“机器味儿”。

3.动结式的生成过程

机器翻译译文生成的任务是从要表达的意义出发,经过选择词语、确定词语间的语义关系、确定目标语句子的句法结构等步骤,最终输出与源语言句子在意义上等价的表层字符串。对于动结式的生成,有以下几步:

(一)确定要表达的意思(四)整合语义结构

(二)选择词语、分派语义角色(五)选择句法表现形式

(三)判断合法性(六)处理表层词语

3.1制定要表达的意思

汉语动结式述语结构表达的是一种“动作—结果”事件。比如要生成的意思是:小王读了这篇文章,结果小王懂了这篇文章。在汉语生成开始之前,机器翻译系统用中介语言逻辑表达式表示要生成的译文是什么意思。一般来说,如果这个表达式里面有两个谓词结构,并且二者之间有“动作—结果”关系,就可以进入汉语动结式的生成过程。

中介语言逻辑表达式是从源语(譬如英语)分析得到的,源语中的述谓结构和“动作—结果”关系会在表达式中有所体现。但这并不是判断能否生成汉语动结式的惟一依据。我们在上一节提到,英语往往没有相当于汉语动结式的结构形式,也很难用转换规则把英语的某些结构形式与汉语动结式联系起来,这是就句法结构来说的。实际上,由于英、汉语之间在“动作—结果”关系表达上的差异,(注:戴浩一(2002)指出:“动作—结果”基模虽然在汉、英语中都存在,但是在汉语中占主导地位,而在英语中占次要甚至边缘地位。而且,这个基模在两个语言对客观情况的构建上也因经验的概念化不同而呈现不同的形式。)在从源语分析得来的语义表达式里,可以用汉语动结式生成的“动作—结果”关系有时是隐含的,与此相关的述谓关系也有不同的表现形式。比如:

英语对动作对象的描写在汉语中有时可以表达成动作的结果:

Shemarriedthewrongperson.她嫁错了人。

Heenteredthewrongdoor.他进错了门。

汉语中动词的结果补语在英语中有时是说明动作的状态和程度的成分:

电视看久了。towatchTVforaverylongtime.

我英语学晚了。ItwasverylatewhenIstartedtolearnEnglish.

还有,致使“动作—结果”事件发生的某些因素在汉语里常常可以充当动结式的一个论元角色,(注:袁毓林(2001)称其为外来的致事。)而在英语里它们往往充当其他成分:

那场可怕的暴风雪冻死了不少人。Manypeoplefrozetodeathintheterriblesnowstorm.

沙发把你坐懒了。Youarebecominglazyonthesofa.

所以我们需要一组规则,在要生成的语义表达式里判断有没有应该用汉语动结式表达的述谓关系。在这组规则里,除了两个谓词结构及其显性的“动作—结果”关系符合判断条件以外,还应该有能够识别和提取隐含的“动作—结果”关系及其述谓结构的条件。这就需要研究英语和汉语在表达“动作—结果”关系时的差异。这种差异有时在某种类别下表现出来,有时又很个性化,只跟具体词语有关。目前机器翻译系统还没有找到这样的规则。所以我们就暂时只能看到“她嫁给了错误的人”和“他进了错误的门”这样的译文。

3.2选择词语

选择词语需要有一部用于信息处理的汉语词典,告诉我们词语

和它们的意义,以及它们的用法(比如,谓词的配价结构及其论元的限制条件)。对于前面的例子,需要先在词典里选出“小王”、“读”、“懂”、“文章”这些词,然后根据词语的意义和逻辑关系为它们分派语义角色。这些词在中介语言逻辑表达式里是实体和谓词。“了”、“结果”、“这”等是算子或关系,把它们转成词汇形式还需要另外的分析和处理。词语选择和语义角色分派的结果可以表示成树形图或特征集合等形式。

附图

图2词语选择和角色分派的结果

Agen表示施事,Pred表示谓词,Pati表示受事,Cont表示内容,Expe表示经验者(当事)。

即使有一部详尽的词典,要让机器根据意义选择词语也不是一件容易的事情。我们经常需要在几个同义词或近义词当中进行取舍。比如,汉语的“看”有read的意思,用它来表达我们要生成的意思比“读”更地道。根据什么样的规则选择“看”,不选择“读”?目前汉语词汇和语义的研究还不能形式化地回答这个问题。机器翻译系统只好先根据词语搭配的优先关系来判断。一种作法是,借助描写词语概念的语义词典,用统计语言模型计算语义相似度,让计算机学会表示和比较词语搭配的优先关系。但是,用这种工程化的方法并不能绕过汉语研究的作用,因为一个统计语言模型能否达到比较好的处理效果,很大程度上取决于采用什么样的语言学知识作为参数。

3.3判断合法性

经过词语选择和角色分派,得到了图2表示的两个谓词结构。这一步的任务是,判断能不能用动结式述语结构表示这两个谓词结构及其关系。具体说就是,“看”和“懂”能不能合成“看懂”,并且表示中介语言逻辑表达式要求的“动作—结果”关系。因此合法性的问题关系到哪些动词和哪些形容词(或动词)能够组合成符合汉语习惯的动结式。

如果给机器翻译系统提供一个词表,列出一批动结式的词语,而“看懂”又刚好在这个词表里,那么判断这件事情就比较容易。譬如,在动词“学”的两个义项(“学习”和“模仿”)下面,《汉语动词用法词典》(孟琮等,1999)列举了8个动结式实例,《中国语补语例解》(侯精一等,2001)列举了12个。这两部词典是面向人的,如果给机器翻译用就还需要收录更多的实例。比如“学懂”、“学腻”,等等(我们在本文的第四部分列举了“学”下面84个可能需要生成的动结式实例)。实际上,词表只适用于小范围的实验型翻译系统。动结式述语是一种自由结构,是根据说话的需要临时造出来的,因此应该是不胜枚举的。

我们可以这样想,“学”是一种认知行为,“懂”、“明白”等词语表示认知活动的效果,因此可以当“学”的结果补语。但人们也常说“这孩子学歪了”、“把身体学垮了”。“歪”和“垮”又根据什么是“学”的结果补语呢?这些补语该用什么条件来生成?我们将在第四部分进一步讨论这个问题。

如果这一步判断的结果是不能生成合法的动结式,那么就需要回到上一步,重新选择词语,直到找不到符合预定的语义要求的词语为止。

3.4整合语义结构

作为一个述谓性的结构整体,动结式有自己语义上的支配成分,包括论元成分和附加成分,我们把这些语义关系的和统称为语义结构。在这一步,我们需要根据动词和补语各自的语义结构,确定动结式整体的语义结构,主要是配价结构(价语的数量和性质)。

动结式的配价结构不等于其构件(动词或补语)的配价结构,也不简单地等于二者之和。动结式的配价与其构件的配价之间有没有对应关系?如何从动词和补语各自的配价结构得到动结式的配价结构?袁毓林(2001)、郭锐(1995)和王红旗(1995)都曾经作过研究,在解释成因的同时,寻找动结式对其构件原有的论元进行选择的控制规则。在一定范围内应用这些规则,我们可以从动词和补语的配价结构推算出动结式的配价结构。包括价语的数量:动结式是一价的、二价的,还是三价的;以及价语的性质:动结式述语结构中各个论元的语义角色是什么(主要分为主体格(主论元)、客体格(宾论元))。对于前面的例句,我们就可以得到,动结式“看懂”是二价的,它的两个论元是“他”(主体格)和“文章”(客体格)。价语的数量和性质是下一步选择句法结构的主要依据。在动结式生成的整个过程中,汉语语法学者提出的论元整合规则是可以直接影响生成算法的规则,这样的结论在目前的汉语语法研究中还为数甚少。机器翻译十分重视这一组规则的作用,也期待着对它更加深入的研究和完善。(注:譬如,袁毓林(2001)提出的准入规则在论元整合结果为等价的情况下是有效的,也是可操作的,对增价的情况虽然有处理的规则,但是计算机不大容易操作,对减价的情况还没有提出有效的处理办法。)

3.5选择句法表现形式

这一步要做的是,选择什么样的句法手段去表现动结式的语义结构。动结式有很多表层结构类型,李临定(1986,181-204页)曾归纳了五类句型:

(1)N[,1]VC妈妈急哭了

(2)N[,1]VN[,2]VC他走路走累了

(3)N[,1]VCN[,2]我点亮了油灯

(4)N[,1]VN[,2]VCN[,3]他拍桌子拍疼了手

(5)N[,1]把N[,2]VCN[,3]火把他的衣服烧穿了几个洞

前四类还各有四种可能的表层变换形式(“把”、“被”、“得”字句及其他)。到底应该选取哪一种生成我们的句子呢?这是如何在语义结构和句法结构之间寻找对应关系的问题,我们打算在第五部分就这个问题作进一步的讨论。

3.6处理表层词语

选定了句子的表层结构和语序以后,剩下的事是用词汇手段表达某些句法或语义范畴。比如:时、体、否定、指代、有定、数量,等等。然后输出最后生成的结果。对于我们的例子就是:“他看懂了这篇文章”。句子里的“了”、“这”和“篇”是在这一步生成的。

机器翻译生成汉语动结式时,在句子表层要处理的问题很多,每一个问题也都很复杂,比如时体成分、否定成分的语序等,需要作专门的研究。

3.7操作过程的控制

需要说明的是,上面各个步骤的操作并不是无条件依次进行的。当在某一步无法得到确定的结论时,应该中止动结式的生成过程。

4.动词和结果补语的组合关系

动词和结果补语的组合应该是基于语义的。要想离开词表的限制,判断哪些动词和哪些形容词(或动词)可以组合成符合汉语习惯的动结式,就需要从语义上研究动补之间的组合类型和规则。显然,这件事情不是机器翻译力所能及的。在这里我们只能先从个例入手,看看单音节动词和单音节形容词作动词“学”的结果补语的情况,或许能够从中看到这个问题的困难所在。

动词“学”的意思是“学习”或“模仿”。在《现代汉语语法信息词典》(注:由北京大学研制的用于信息处理的电子词典,其中有按义项收录的14479个动词,2856个形容词。通过检索每个词的属性,我们可以知道哪些动词可以带结果补语,哪些形容词、动词可以作结果补语。)(俞士汶,1998,以下称《语法信息词典》)中,列出了可以作结果补语的单音节形容词204个,(注:马真等(1997)列出了可以作结果补语的单音节形容词153个。)单音节动词112个。经过一一搭配测试,其中有54个形容词和30个动词能作“学”的结果补语。这样我们就从《语法信息词典》中一共得到了84个可能的动结式实例。然后按照《知网》(注:用于自然语言处理的知识系统,由董振东等研制。以从大量词语中提取出来的“义原”为基本描述单位,采用一种结构化的描述语言来描述概念与概念之间,以及概念的属性与属性之间的关系,包括上下位关系、同义关系、反义关系、对义关系、部件与整体关系、材料和成品关系、属性和宿主关系,以及属性值和属性的指向关系、时间和角色关系。互联网网址:)(董振东等,2001)的定义为每一个实例的补语作语义类别标注,再作聚类分析,整理出“学”的结果补语的六个语义类别。其中A、E、F三类作补语的是形容词,B、C、D三类作补语的是动词,分别列在下面(括号里面是《知网》定义的义原)。

A.人的客观属性(智能、举止、年龄、外貌、品性、经济状况)

A1.[智能]学笨了学昏了学蒙了学痴了学蠢了学土了学呆了学木了学乖了学傻了

A2.[举止]学刁了学歪了学贼了学油了学浮了学狠了学犟了学俗了学倔了学皮了学酸了学混了学抠了

A3.[年龄]学老了

A4.[经济状况]学富了学穷了

A5.[品性]学差了学废了学好了学黑了学坏了学糟了

A6.[外貌]学俏了

B.人的主观感受(态度、感知)

B1.[态度]学烦了学够了学惯了学迷了学恼了学腻了学怕了

B2.[感知]学懂了学乏了学会了学累了学通了学忘了

C.人的状态和行为(状态、行动)

C1.[状态]学病了学成了学疯了学垮了学亏了学蔫了学瘸了学死了学瘫了学哑了学晕了

C2.[行动]学哭了学跑了学散了学走了

D.事物的状态(状态)

学丢了学没了

E.事物的特性(特性)

学反了学活了学偏了学浅了学深了学杂了学窄了学足了

F.事

件的特性(特性)

学遍了学迟了学重了学错了学对了学多了学久了学滥了学全了学少了学透了学晚了学早了

可以看出,“学”和它的结果补语之间在概念意义的组合上遵循一定的规律。能否根据这些规律,用计算机可操作的方法,在一定范围内判断词表以外的动结式实例是否合法?比如,《语法信息词典》没有把“精”列入可作结果补语的形容词当中,但是“学精了”是个合法的动结式实例。计算机可以这样来确认它的合法性:根据《知网》,“精”的定义是[智能>灵](“>”的右部是左部的下位概念。下同),在A1类[智能>愚/讷/智/灵](“/”表示“或”的意思。下同。)的范围内。同样,与“精”定义相同的“鬼”、“灵”、“巧”,虽然也没有被《语法信息词典》指明可作结果补语,但计算机仍然能够判定“学鬼了”、“学灵了”和“学巧了”是合法的动结式实例。

对于动补之间的语义组合,结果补语的概念意义是在动词概念意义的制约下起作用的。我们再来看与“学”有对义关系(Converse)的动词“教”。“学”和“教”都表示认知行为,前者是使自我认知,后者是使他人认知。因此有可能要求相似的结果补语。实际上,“学”的结果补语基本上都可以作“教”的结果补语。(注:尽管各自的语义指向可能不同,比如:“学笨了”和“教笨了”。这与动词的配价结构有关。在机器翻译生成动结式的过程中,由“整合语义结构”这一步处理。)它们或者表示认知行为对其主体(“学”的施事、“教”的与事)产生的效果:改变主体的客观属性(智能、举止、年龄、外貌、品性、经济状况)、主观感受(态度、感知)、状态和行为;或者表示认知行为对其涉及的事物产生的效果:改变涉及对象的状态、性质(长短、宽窄、深浅、多少、正反、美丑);或者表示认知行为本身的特性(度量、频率、程度)。不同的“动作—结果”关系产生了不同的动补组合关系,要把它们研究清楚,整理成规则,是一件非常复杂的事情。

即使有了基于词语概念意义的规则,也还不能完全解决问题。在《知网》中,与“懂”有相同定义的单音节动词还有“认”、“审”、“识”、“通”、“悉”、“晓”、“知”。除了“通”以外,其余的都不能作“学”的结果补语。与“精”定义相同的双音节形容词“聪明”、“机灵”、“伶俐”、“乖巧”可以作“学”的结果补语,而同样定义的“聪颖”、“聪慧”却不行。这说明影响动词和结果补语组合关系的因素不仅仅是词语的概念意义。那么,到底还有哪些因素可以作为判断动结式合法与否的条件?如何把这些条件变成计算机可以操作的规则?我们现在还不得而知。

5.从语义结构到句法表现形式

在动结式的整个生成过程中,选择什么样的句法手段来表现其语义结构是比较复杂的一步。人们常说,汉语句法结构和语义结构之间的联系比较松散,或者说句法成分和语义成分的配位很灵活,一种结构形式经常表示多种意义,一种语义内容也可以用多种结构形式来表示。这就给机器翻译的汉语生成带来很大的困难。对于动结式表层句法结构的选择,我们目前能用到的条件非常有限,所以能生成的句型也很有限。

5.1使生成目标受限

通过整合语义结构我们得到了动结式的配价结构,价语的数量可以帮助我们选择句型。如果动结式是一价的,选择有一个体词性成分出现的句型;是二价的,选择包含两个体词性成分的句型。至于在同属一类句型的多个表层结构形式中间应该选择哪一个,还需要更细致的条件和规则。下面讨论如何把动结式组成成分之间的语义关系作为选择的条件。

为了简化讨论的过程,我们在这里只考虑二价动结式的情况(略去“妈妈急哭了”、“他看书看花了眼”、“他扔进屋一块石头”等)。这样,讨论的范围就限制在只含有两个体词性成分的表层结构形式里面。吕叔湘(1986)曾经按照补语跟主语或宾语的语义关系,把动结式述补结构分成15类(略去“得”字句等),其中有两个体词性论元成分出现的共9类(包括用“把”和“被的句子),分属以下三种语义关系格式,其中S是V的主体格。(注:在本节讨论的范围内,主体格包括施事、当事;客体格包括受事、内容。)

附图

综合上述各种情况可以看出,二价动结式的六种语义结构可以用以下五种表层结构形式来表达。下面的讨论将在这个范围以内进行:

表层结构1:SVCO

表层结构2:S“把”OVC

表层结构3:O“把”SVC

表层结构4:O“被”SVC

表层结构5:S“被”OVC

我们注意到,同时与二价动结式的六种语义结构有对应关系的只有表层结构1(SVCO),所以可以把它当作生成动结式表层的首选。可是进一步观察就会发现,在用表层结构1表

达某些语义结构时会受到限制。譬如语义结构Ⅱ,我们可以说“大家吃腻了剩菜”,却不能说“我丢怕了钱包”,也不能说“他看傻了那幅画”。能说与不能说应该有条件来控制,O和C之间的语义关系可能是一个控制条件,但是目前还没有确切的规则可用。

在这种情况下,只好先避开表层结构1,选择2和3。经过初步实验我们看到,就表达命题意义来说,用表层结构3表达语义结构Ⅱ,用表层结构2表达语义结构Ⅰ、Ⅲ、Ⅳ、Ⅴ、Ⅵ,受到的限制最少。这样,讨论的范围又缩小到了两种表层结构形式。问题就变成了:如何找到用这两种句法形式表达六种语义关系格式的控制条件。我们把这种逐步缩小问题范围的做法叫作使生成目标受限,实际上这是对复杂问题的一种妥协。也就是对二价动结式,放弃生成所有的表层句式,寻找尽可能简单和有效的控制条件,先用部分表层结构形式表达其多种语义格式。

5.2生成表层结构的控制条件

从语义结构生成表层结构的主要控制条件是动结式组成成分之间的语义关系。

对于二价动结式的组成成分S、O、V、C,如果S是V的主体格,而且:

(一)如果S、O、V、C相互之间满足下列五个条件之一,则可以用表层结构2表达:

1.(O是V的客体格)且(O是C的主体格)且(C是一价的)

2.(S是C的主体格)且(O是V的客体格)且(O是C的客体格)

3.(O是C的主体格)且(V和C都是一价的)

4.(S是C的主体格)且(O是C的客体格)且(V是一价的)

5.(O是V的客体格)且(C是V的修饰成分)

(二)如果S、O、V、C相互之间满足条件6,则可以用表层结构3表达:

6.(O是V的客体格)且(S是C的主体格)且(C是一价的)

表层结构2和3都是“把”字句。关于“把”字句,很多学者从各种角度作过研究。张伯江(2000)曾根据句式语法的观点指出,除了组成成分的作用以外,“把”字句的整体意义当中还有句式意义的作用。因此,生成的时候还应当考虑上述控制条件能否符合“把”字句句式意义的要求。我们注意到,动结式与“把”字句似乎有一种自然的联系。“把”字句中V的“处置”意义、C是“把”后面宾语产生的变化等句式意义与动结式的句式意义基本相似。(注:在动结式的表层结构2中,宾语是O;在表层结构3中,宾语是S。)另外,为了体现“把”字句里动作过程的完整性,我们在生成过程的最后一步(处理表层词语)规定,“把”字后面排斥否定谓语形式。根据我们的观察和实验,在二价动结式述语结构的五种表层形式中,“把”字句在语义表达的适应性上比较好,常常能够包容除语义关系之外的其他一些选择控制因素。譬如,补语是双音节的动结式一般不宜选择表层结构SVCO,但“把”字句不受这个限制。再如,用“把”字句来表达“你把坑挖浅了”这一类含有动结式的句子,正好能够表示其偏离预期结果的意思,比用其他表层结构更合适一些。“把”字句在动结式生成中为什么会有这样的表现?这不是机器翻译能够解释的问题。

现在再来看我们要生成的例句:“小王读了这篇文章,结果小王懂了这篇文章”。经过“动作—结果”述谓关系的判断、词语选择、合法性判定和语义结构整合,我们得知,它可以生成一个二价的动结式述补结构,其中各个组成成分之间的语义关系是:

SVO&SCO

这种语义结构符合控制条件2(S是V和C的主体格,而且O是V和C的客体格)。因此为它选择的表层句法形式是:

S“把”OVC

再经过表层词语的处理,最后生成:

小王把这篇文章看懂了。

6.余论

戴浩一(2002)在论述汉语语法的哲学基础时指出,语法现象是概念系统概念化的结果。他从宏观角度提出了从概念结构到汉语句法和词汇形式的过程,说明在这个过程中起作用的是汉语的概念化原则。应该说,机器翻译从中介语言逻辑表达式生成动结式译文的过程就是这样一个实例。从“动作—结果”述谓关系的判断、词语选择、合法性判定、语义结构整合、直到句法形式选择和表层词语处理,我们需要的是具体的、可操作的句法化、词汇化的原则和规则,这样才能从生成机制上找到动结式的构成条件。多年来,汉语语法一直比较重视动结式述语结构的研究,在结构层次、结构关系、句法功能、语义关系、配价结构,还有组成成分的特征和性质等问题上有许多论述。只是研究结论多数是面向人的,能为汉语信息处理和机器翻译所用的还不多。比如,关于动结式是如何形成的,人们大多从历时的角度,指出它的来源是古代汉语的使动用法。而机器翻译需要的是从共时的角度找到动结式形成的控制条件,告诉计算机,在什么情况下,哪些动词和哪些形容词(或动词)可以组合成、以及怎么组合成符合汉语习惯的动结式述语结构。还有,如何从要生成的句子意思里找到“动作—结果”关系及其述谓结构?如何根据要表达的意思选择合适的词语?如何从动词和补语的配价结构推算出动结式的配价结构?如何从动结式的语义结构选择它的句法表现形式?以及如何在句子表层处理时体成分、否定成分、指代关系、数量关系?在没有找到解决这些问题的有效规则以前,机器翻译系统还只能采用某些权宜之计来生成汉语的动结式。

在强调规则的作用的同时,我们也看到统计语言模型的方法近年来越来越多地应用在语言工程中,出现了基于实例的和基于统计的机器翻译系统。在人们对语言和翻译的机制还缺乏系统的了解,还没有一种适合信息处理的语言理论可以应用的时候,统计语言模型可能会起到某种依靠“量”来获取“质”的作用。它的前提是,大量语言现象的统计规律能够确切地反映语句的构造规律和言语过程的认知规律。而实际上,这还是有待证明的观点。更何况统计语言模型需要建立在语言学知识的基础上,一个语言模型能否达到比较好的处理效果,很大程度上取决于我们能为它提供什么样的语言学知识作为参数。计算的任务是获取参数之间的统计学规律,参数才是建立模型的根本。目前统计模型方法在机器翻译系统中效果不佳,其主要原因应该不是模型本身的计算能力有限,而是能够提供给模型的关于机器翻译的知识太少。汉语语法研究目前还没有发掘出足够的这一类知识,或者是还没有把它们系统地、结构化地组织起来。这一点对基于规则的方法来说,同样也是亟待解决的问题。

从机器翻译系统总体设计的角度说,汉语动结式的生成包括两个方面的问题。一个是根据哪些语言知识来生成,这与汉语研究有密切关系;另一个是怎样实现生成的过程,这是把问题形式化和设计算法的事情。我们讨论的内容只涉及第一个方面,目的是通过对动结式生成过程的描述,看看它需要哪些语言学知识的支持。实际上,我们谈到的生成过程还相当粗略,提出的问题也仅仅是一小部分。曾经有人(白硕,1996)说过,继说本族语言的人和说非本族语言的人之后,计算机的出现给语言研究带来了一个新的参照物。它将帮助人们认识到一些在旧的参照物下很难揭示出来的语言现象和规律。希望我们提出的这些问题也能成为这样的一种“参照”。

【参考文献】】

1白硕1996《语言研究中的实用主义》,《计算机时代的汉语和汉字研究》,北京,清华大学出版社。

2戴浩一2002《概念结构与非自主性语法:汉语语法概念系统初探》,《当代语言学》第1期。

3董振东等2001《知网和汉语研究》,《当代语言学》第1期。

4郭锐1995《述结式的配价结构与成分的整合》,《现代汉语配价语法研究》,沈阳等主编,北京大学出版社。

5侯精一等2001《中国语补语例解》(日文版),北京,商务印书馆。

6黄昌宁等主编2001《自然语言理解与机器翻译》,北京,清华大学出版社。

7Hutchins,W.J.1993《机器翻译:过去、现在、未来》,台湾,致文有限公司。

8李临定1986《现代汉语句型》,商务印书馆。

9——1980《动补格句式》,《中国语文》第2期。

10陆俭明1990《“VA了”述补结构的语义分析》,《汉语学习》第1期。

11吕叔湘1986《汉语句法的灵活性》,《中国语文》第1期。

12马希文1987《与动结式动词有关的句式》,《中国语文》第6期。

13马真等1997《形容词作结果补语情况考察》,《汉语学习》第1期。

14孟琮等1999《汉语动词用法词典》,北京,商务印书馆。

15王红旗1995《动结式述补结构配价研究》,《现代汉语配价语法研究》,沈阳等主编,北京大学出版社。

16翁富良等1998《计算语言学导论》,北京,中国社会科学出版社。

17俞士汶1998《现代汉语语法信息词典》,清华大学出版社。