- A+
C#(读作“See Sharp”)是一种新式编程语言,不仅面向对象,还类型安全。 C# 源于 C 语言系列,C、C++、Java 和 JavaScript 程序员很快就可以上手使用。
一、在 .NET 之前
C# 编程语言是为了在微软公司的 .NET 框架(.NET Framework)上开发程序而设计的。本文将简要介绍 .NET 从何而来,以及它的基本架构。
20 世纪 90 年代末,使用微软平台的 Windows 编程分化成许多分支。大多数程序员使用 Visual Basic(VB)、C 或 C++。一些 C 和 C++ 程序员在使用纯 Win32 API,但大多数人在使用 MFC(Microsoft Foundation Class,微软基础类库)。其他人已经转向了COM(Component Object Model,组件对象模型)。
所有这些技术都有自己的问题。纯 Win32 API 不是面向对象的,而且使用它的工作量比使用 MFC 的更大。MFC 是面向对象的,但是它不一致,并逐渐变得陈旧。COM 虽然概念简单,但它的实际代码复杂,并且需要很多丑陋的、不优雅的底层基础代码。
所有这些编程技术还有一个缺点是它们主要针对桌面程序而不是互联网进行开发。那时 Web 编程还是以后的事情,而且看起来和桌面编程非常不同。
我们真正需要的是一个集成的、面向对象的开发框架,它可以把一致和优雅带回编程。为满足这个需求,微软打算开发一个代码执行环境和一个可以实现这些目标的代码开发环境。这些目标列在下表中:
- 执行环境的目标
- 安全
- 多平台
- 性能
- 开发环境的目标
- 面向对象的开发环境
- 一致的编程体验
- 使用行业标准进行通信
- 简化部署
- 语言独立
- 互操作性
二、.NET 时代
2002 年,微软发布了 .NET 框架的第一个版本,声称其解决了原有问题并实现了下一代系统的目标。.NET 框架是一种比 MFC 和 COM 编程技术更一致并面向对象的环境。它的特点包
括以下几点:
- 多平台 该系统可以在各种计算机上运行,从服务器、桌面机到 PDA,还能在移动电话上运行。
- 行业标准 该系统使用行业标准的通信协议,比如 XML、HTTP、SOAP、JSON 和 WSDL。
- 安全性 该系统能提供更加安全的执行环境,即使有来源可疑的代码存在。
2.1 .NET 框架的组成
.NET 框架由三部分组成,如下图所示。执行环境称为 CLR(Common Language Runtime,公共语言运行时)。CLR 在运行时管理程序的执行,包括以下内容:
- 内存管理和垃圾回收。
- 代码安全验证。
- 代码执行、线程管理及异常处理。
编程工具涵盖了编码和调试需要的切,包括以下几点:
- Visual Studio 集成开发环境(IDE)。
- .NET 兼容的编译器(例如: C#、Visual Basic .NET、F#、IronRuby 和托管的 C++)。
- 调试器。
- Web 开发服务器端技术,比如 ASP.NET 或 WCF。
BCL(Base Class Library,基类库)是 .NET 框架使用的一个大的类库,而且也可以在你的程序中使用。
2.2 改进的编程环境
较之以前的 Windows 编程环境,.NET 框架为程序员带来了相当大的改进。下面将简要阐述它的特点及其带来的好处。
-
面向对象的开发环境
CLR、BCL 和 C# 完全是面向对象的,并形成了良好的集成环境。
系统为本地程序和分布式系统都提供了一致的、面向对象的编程模型。它还为桌面应用程序、移动应用程序和 Web 开发提供了软件开发接口,涉及的目标范围很广,从桌面服务器到手机。
-
自动垃圾回收
CLR 有一项服务称为 GC(garbage collector,垃圾回收器),它能自动管理内存。GC 自动从内存中删除程序不再访问的对象。
GC 使程序员不再操心许多以前必须执行的任务,比如释放内存和检查内存泄漏。这可是个很大的改进,因为检在内存泄源可能非常困难而且耗时很长。
-
互操作性
.NET 框架专门考虑了不同的 .NET 语言、操作系统或 Win32 DLL 和 COM 之间的互操作性。
- .NET 语言的互操作性允许用不同的 .NET 语言编写的软件模块无缝地交互。
- 用一种 .NET 语言写的程序可以使用甚至继承用另外一种 .NET 语言写的类,只需要遵循一定的规则即可。
- 正因为能够很容易地集成不同编程语言生成的模块,.NET 框架有时被称为是语言无关的。
- .NET 提供一种称为平台调用(platform invoke, P/Invoke)的特性,允许 .NET 的代码调用并使用非 .NET 的代码。它可以使用标准 Win32 DLL 导出的纯 C 函数的代码,比如 Windows API。
- .NET 框架还允许与 COM 进行互操作。.NET 框架软件组件能调用 COM 组件,而且 COM 组件也能调用 .NET 组件,就像它们是 COM 组件一样。
- .NET 语言的互操作性允许用不同的 .NET 语言编写的软件模块无缝地交互。
-
不需要 COM
.NET 框架使程序员摆脱了 COM 的束缚。作为一名 C# 程序员,你肯定很高兴不需要使用 COM 编程环境,因而也不需要下面这些内容。
- IUnknown 接口 在 COM 中,所有对象必须实现 IUnknown 接口。相反,所有 .NET 对象都继承一个名为
object
的类。接口编程仍是 .NET 中的个重要部分,但不再是中心主题了。 - 类型库 在 COM 中,类型信息作为 .tlb 文件保存在类型库中,它和可执行代码是分开的。在 .NET 中,程序的类型信息和代码起被保存在程序文件中。
- 手动引用计数 在 COM 中,程序员必须记录一个对象的引用数目以确保它不会在错误的时间被删除。在 .NET 中,GC 记录引用情况并只在合适的时候删除对象。
- HRESULT COM 使用 HRESULT 数据类型返回运行时错误代码。.NET 不使用 HRESULT。相反,所有意外的运行时错误都产生异常。
- 注册表 COM 应用必须在系统注册表中注册。注册表保存了与操作系统的配置和应用程序有关的信息。.NET 应用不需要使用注册表,这简化了程序的安装和卸载。(但有功能类似的工具,称为全局程序集缓存,即 GAC。)
尽管现在不太需要编写 COM 代码了,但是系统中还在使用很多 COM 组件,C# 程序员有的时候需要编写代码来和那些组件交互。C# 4.0 引入了几个新的特性来简化这个工作。
- IUnknown 接口 在 COM 中,所有对象必须实现 IUnknown 接口。相反,所有 .NET 对象都继承一个名为
-
简化的部署
为 .NET 框架编写的程序进行部署比以前容易很多,原因如下。
- .NET 程序不需要使用注册表注册,这意味着在最简单的情形下,一个程序只需要被复制到目标机器上便可以运行。
- .NET 提供种称为并行执行的特性, 允许一个 DLL 的不同版本在同一台机器上存在。这意味着每个可执行程序都可以访问程序生成时使用的那个版本的 DLL。
-
类型安全性
CLR 检查并确保参数及其他数据对象的类型安全,不同编程语言编写的组件之间也没有问题。
-
基类库
.NET 框架提供了一个庞大的基础类库,很自然地,它被称为基类库(Base Class Libray,BCL)。在写自己的程序时,可以使用其中的类,如下所示。
- 通用基础类 这些类提供了一 组极为强大的工具,可以应用到许多编程任务中,比如文件操作、字符串操作、安全和加密。
- 集合类 这些类实现了列表、字典、散列表以及位数组。
- 线程和同步类 这些类用于创建多线程程序。
- XML类 这些类用于创建、读取以及操作 XML 文档。
在编程领城,你现在面临的任务,尤其是最基本的任务,几乎都有人执行过了。BCL 的想法是为大多数一般性任务提供内建功能,这样你的职责就只是拼凑这些功能并编写应用程序所需的专用代码。不要担心,剩下的任务仍然需要你具备大量的知识和技能。
三、编译成 CIL
.NET 语言的编译器接受源代码文件,并生成名为程序集的输出文件。下图描述了这个过程。
- 程序集要么是可执行的,要么是 DLL。
- 程序集里的代码并不是本机代码,而是种名称为 CIL(Common Intermediate Language,公共中间语言)的中间语言。
- 程序集包含的信息中,包括下列项目:
- 程序的 CIL;
- 程序中使用的类型的元数据;
- 对其他程序集引用的元数据。
四、编译成本机代码并执行
程序的 CIL 直到被调用运行时才会被编译成本机代码。在运行时,CLR 执行下面的步骤:
- 检查程序集的安全特性
- 在内存中分配空间
- 把程序集中的可执行代码发送给即时(just-in-time,JIT)编译器,把其中的一部分编译成本机代码。
程序集中的可执行代码只在需要的时候由 JIT 编译器编译,然后它就被缓存起来以备在后来的程序中执行。使用这个方法意味着不被调用的代码不会被编译成本机代码,而且被调用到的代码只被编译一次。
一旦 CIL 被编译成本机代码,CLR 就在它运行时管理它,执行如释放无主内存、检查数组边界、检查参数类型和管理异常之类的任务。两个重要的术语由此而生。
- 托管代码 为 .NET 框架编写的代码称为托管代码(managed code),需要 CLR。
- 非托管代码 不在 CLR 控制之下运行的代码,比如 Win32 C/C++C DLL,称为非托管代码(unmanaged code)。
微软公司还提供了一个称为本机映像生成器的工具 Ngen,可以把一个程序集转换成当前处理器的本机代码。Ngen 处理过的代码免除了运行时的 JIT 编译过程。
编译和执行
无论原始源文件的语言是什么,都遵循同样的编译和执行过程。下图说明了 3 个用不同语言编写的程序的完整编译时和运行时过程。
五、CLR
.NET 框架的核心组件是 CLR,它在操作系统的顶层,负责管理程序的执行,如下图所示:
CLR 还提供下列服务:
- 自动垃圾回收;
- 安全和认证;
- 通过访问 BCL 得到广泛的编程功能,包括如 Web 服务和数据服务之类的功能。
六、CLI
每种编程语言都有一组内置的类型,用来表示如整数、浮点数和字符等之类的对象。过去,这些类型的特征因编程语言和平台的不同而不同。例如,组成整数的位数对于不同的语言和平台就有很大差别。
然而,这种统一性的缺乏使我们难以让使用不同语言编写的程序及库一起良好协作。为了有序协作,必须有组标准。
CLI(Common Language Infrastructure,公共语言基础结构)就是这样一组标准, 它把 .NET 框架的所有组件连结成一个内聚的、一致的系统。它展示了系统的概念和架构,并详细说明了所有软件都必须遵守的规则和约定。CLI 的组成如下图所示:
CLI 和 C# 都已经被 Eema International 批准为开放的国际标准规范。Ecma 本来是 Europen Computer Manufacturer Association(欧洲计算机制造商协会)的缩写,但现在已经不是缩写了,它就是一个词。 Ecma 的成员包括微软、IBM、惠普、谷歌、雅虎等众多和计算机及消费性电子产品有关的公司。
CLI 的重要组成部分
虽然大多数程序员不需要了解 CLI 规范的细节,但至少应该熟悉公共类型系统和公共语言规范的含义和用途。
-
公共类型系统
CTS(Common Type system,公共类型系统)定义了那些在托管代码中一定会使用的类型的特征。CTS 的一些重要方面如下。
- CTS 定义了一组丰富的内置类型,以及每种类型固有的、独有的特性。
- .NET 兼容编程语言提供的类型通常映射到 CTS 中已定义的内置类型集的某一个特殊子集。
- CTS 最重要的特征之一是所有类型都继承自公共的基类——object。
- 使用 CTS 可以确保系统类型和用户定义类型能够被任何 .NET 兼容的语言所使用。
-
公共语言规范
CLS(Common Langage Spifcien,公共语言规范)详细说明了一个 .NET 兼容编程语言的规则、属性和行为,其主题包括数据类型、类结构和参数传递。
七、各种缩写
本文包含了许多 .NET 缩写,下表将帮助你直观第理解它们。
- 程序集
- 公共中间语言(CIL、IL 或 MSIL)
- 公共语言运行库(CLR)
- 垃圾回收器(GC)
- 即时编译器(JIT)
- 基类库(BCL)
- 公共语言基础结构(CLI)
- 公共类型系统(CTS)
- 公共语言规范(CLS)
(完)