9级天目山野外实习论文 复旦大学生命科学学院 2002年7月
复旦大学生命科学学院 2002 年 7 月
目录 1.叶脉与叶形相关性分析及其可能进化原因 2.蕨类植物茎轴几何形态的分类与进化 3.昆虫步态的形式、结构与对称性 4.人工环境影响下的蚂蚁捕食问题 24 5.西天目山荨麻科植物分布及生境调查 6.天目山部分蛾类拟态现象的观察 7.天目山溪水水生昆虫调查 8.关于天蛾科和金龟子总科昆虫对红光和紫光趋光性不同的 研究 9.天目山常见蜘蛛的鉴定及其生活习性的研究 47 10.萤火虫发光机制浅探 11.天目山毛竹竹节长度与胸径之间线性回归关系研究 12.天目山三种常见燕子的初步调查… 基于竹鞭状态分析的抑制毛竹林扩散的方法的提出 14.天目山常见攀援植物资源与应用的研究 15.西天目山七里亭到开山老殿段柳杉种群年龄结构及生长状况 16.天目山竹业发展对保护区生物多样性的影响及建议 96 17.西天目柳杉树皮考察及新发现 天目山生态旅游现状调查与开发前景展望
目录 1 叶脉与叶形相关性分析及其可能进化原因 ·········································· 1 2 蕨类植物茎轴几何形态的分类与进化 ·················································· 4 3 昆虫步态的形式 结构与对称性 ························································ 20 4 人工环境影响下的蚂蚁捕食问题 ························································ 24 5 西天目山荨麻科植物分布及生境调查 ················································ 28 6 天目山部分蛾类拟态现象的观察 ························································ 31 7 天目山溪水水生昆虫调查···································································· 38 8 关于天蛾科和金龟子总科昆虫对红光和紫光趋光性不同的 研究······································································································ 44 9 天目山常见蜘蛛的鉴定及其生活习性的研究 ···································· 47 10 萤火虫发光机制浅探·········································································· 52 11 天目山毛竹竹节长度与胸径之间线性回归关系研究······················· 55 12 天目山三种常见燕子的初步调查 ······················································ 60 13 基于竹鞭状态分析的抑制毛竹林扩散的方法的提出······················· 66 14 天目山常见攀援植物资源与应用的研究 ·········································· 72 15 西天目山七里亭到开山老殿段柳杉种群年龄结构及生长状况 调查···································································································· 79 16 天目山竹业发展对保护区生物多样性的影响及建议······················· 96 17 西天目柳杉树皮考察及新发现 ························································ 99 18 天目山生态旅游现状调查与开发前景展望 ···································· 104
叶脉与叶形相关性分析及其可能进化原因 鲁伯埙王昕张昊 叶脉类型与叶片本身的形状是描述植物叶子的两个主要性状。两者在进化上有无关联,目前尚无定论。本文作者通过 实验证明了两者的相关性,并探讨了其可能进化原因及其运用 《叶脉脉序与资源输运模式》(见参考文献()一文中,提|A虎耳草科山梅花193170 出了以叶脉形状作为资源输运管道的模型,其根据是在大多数植 A陕竹桃科 1.58250 1.04 3|23 0.53 中为的叶在的料第F2如三盒2212 化上的优势。这与生产实践中资源输运的要求是一致的,因此可A|菊科 奇蒿25022222231012 A|菊科 金鸡菊950970888936032 以有仿生学上的应用价值。这实际上是以叶脉和叶形的相关性为A菊科香丝草1250123813m1128057 前提的。如果两者在统计学上不相关,叶脉也就不可能对叶形存A爵床科九头狮子草|238238250242006 在最优关系,从而失去了应用价值。参考文献[]中还利用数学计 A|壳斗科 苦槠22123022522500 03 A|壳斗科 278233242251018 算,说明了这样一个结论,即对离心率比较大的椭圆叶片,平行A苦木科臭椿25525927264010 脉及弧形脉在进化上占优势:反之,网状脉占优势。本文以此为A蓼科 虎杖 1611.551401.52008 突破口,统计不同叶脉类型的叶片在离心率的分布上有无不同 A鞭草科紫珠 2132132282.18007 A|马钱科 醉鱼草 2352442.252.350.06 如果有显著不同,则说明真实植物界中确实有此相关性,并有其A漆树科黄连木375294412|36004 进化原因及应用价值 A|漆树科盐肤木2112.002052050 A荨麻科苎麻155150147151003 A荨麻科楼梯草|267200244237025 材料与方法 A茜草科六月雪1.502.122462030.35 1.采集标本 A伞形科鸭脚芹1351.1611512009 A|桑科 于中国浙江省西天目山采集各植株上的完整、成熟、椭圆叶 薜荔14514511134015 A商陆科美洲商陆1751821.541700.1 片,每种若干。用标本夹压平。共计取材35个科,66个种 A洁油科野鸭椿145141196160024 2.测量。 A逶骨草科透骨草1551501.90165017 所采集的每个种随机取三片完整、成熟叶片,用毫米尺测量 A卫矛科丝棉木133125122127004 19 其长轴和短轴长度,估读至0.1mm A榆科糙叶树|2231.67162184026 3.计算。 A|樟科狭叶山胡椒|2702711.84242038 对所测三片叶片,求其长轴与短轴之比,作为基础数据,计 A樟科山胡椒229217225223004 A樟科天目木姜子1371421751.510.16 算每个种的平均值、标准误。再进行统计分析。 A|樟科 紫楠 3222432682780.30 基础数据见下表 B禾本科疏花雀麦316450.1447754318769 比1比2比3/平均标准 B禾本科求米草282275278278002 脉型科 种 B禾本科五节芒29652526291628.02184 A败酱科败酱1802171941970 B|禾本科淡竹叶1339741200102086 A大戟科白背叶|1009810102004 B|禾本科芒属某种|2792290922802660254 A|大戟科叶下珠171821.881804 B|禾本科狗尾草1500166015001553071 A|豆科 黄檀168159147|1.5807 B禾本科 500860467609167 A豆科小槐花1942001.671870.1 B|禾本科柳叶箬1533593573567022 A 科大叶胡枝子|12914714113900 B鸬跖草科鸭跖草4404784.36451018 科山合欢233267223241017 棕榈982988135106162 A豆科 云实 1922002312070.16 B百合科菝葜130141149140006 A|豆科 野大豆131.471.251.350.08 B百合科油点草 A|杜仲科杜仲219262250244017 B荨麻科糯米团3482802.31286041 A椴树科扁担杆子尖叶23220325237025 B荨麻科冷水花1.58155131148011 A椴树科扁担杆子(圆叶)1.331711.541.530.13 表中叶脉类型用符号表示,A表示网状脉,B表示平行或弧 A胡桃科山核桃34239346342003形脉。由于平行脉与弧形脉的拓扑结构一致,所以并作一类 A胡桃科青钱柳27129026827609 A|胡桃科 化香 2.101801.9 A颓子科佘山胡颓子218212200210007 结果与分析 A同颓子科胡颓子|262295315291019 首先,下图表明了两个性状分布的总体情况 A葫芦科绞股蓝2502052502350.20 A|葫芦科 286283278282003 图中,纵坐标是35个科,横坐标表示长轴与短轴比例 A虎耳草科土常山|216200210209006 下简称长短比)的分布。黑色条形表示测量得网状脉的长短之比 A虎耳草科虎耳草09811110011.03005范围,白色条形表示测量得平行与弧状脉的长短之比范围。红线
叶脉与叶形相关性分析及其可能进化原因 鲁伯埙 王 昕 张 昊 叶脉类型与叶片本身的形状是描述植物叶子的两个主要性状。两者在进化上有无关联,目前尚无定论。本文作者通过 实验证明了两者的相关性,并探讨了其可能进化原因及其运用。 《叶脉脉序与资源输运模式》(见参考文献[1])一文中,提 出了以叶脉形状作为资源输运管道的模型,其根据是在大多数植 物中以营养输运为主要功能的叶脉,在保证将水、盐、有机物等 输送至每个细胞的前提下,应该尽可能节省材料,这样可能有进 化上的优势。这与生产实践中资源输运的要求是一致的,因此可 以有仿生学上的应用价值。这实际上是以叶脉和叶形的相关性为 前提的。如果两者在统计学上不相关,叶脉也就不可能对叶形存 在最优关系,从而失去了应用价值。参考文献[1]中还利用数学计 算,说明了这样一个结论,即对离心率比较大的椭圆叶片,平行 脉及弧形脉在进化上占优势;反之,网状脉占优势。本文以此为 突破口,统计不同叶脉类型的叶片在离心率的分布上有无不同。 如果有显著不同,则说明真实植物界中确实有此相关性,并有其 进化原因及应用价值。 材料与方法 1. 采集标本。 于中国浙江省西天目山采集各植株上的完整、成熟、椭圆叶 片,每种若干。用标本夹压平。共计取材 35 个科,66 个种。 2. 测量。 所采集的每个种随机取三片完整、成熟叶片,用毫米尺测量 其长轴和短轴长度,估读至 0.1mm。 3. 计算。 对所测三片叶片,求其长轴与短轴之比,作为基础数据,计 算每个种的平均值、标准误。再进行统计分析。 基础数据见下表: 脉型 科 种 长宽 比 1 长宽 比 2 长宽 比 3 平均 标准 偏差 A 败酱科 败酱 1.80 2.17 1.94 1.97 0.14 A 大戟科 白背叶 1.07 0.98 1.01 1.02 0.04 A 大戟科 叶下珠 1.75 1.82 1.88 1.81 0.04 A 豆科 黄檀 1.68 1.59 1.47 1.58 0.07 A 豆科 小槐花 1.94 2.00 1.67 1.87 0.14 A 豆科 大叶胡枝子 1.29 1.47 1.41 1.39 0.07 A 豆科 山合欢 2.33 2.67 2.23 2.41 0.17 A 豆科 云实 1.92 2.00 2.31 2.07 0.16 A 豆科 野大豆 1.33 1.47 1.25 1.35 0.08 A 杜仲科 杜仲 2.19 2.62 2.50 2.44 0.17 A 椴树科 扁担杆子(尖叶) 2.32 2.03 2.75 2.37 0.25 A 椴树科 扁担杆子(圆叶) 1.33 1.71 1.54 1.53 0.13 A 胡桃科 山核桃 3.42 3.39 3.46 3.42 0.03 A 胡桃科 青钱柳 2.71 2.90 2.68 2.76 0.09 A 胡桃科 化香 2.10 1.80 1.97 1.96 0.10 A 胡颓子科 佘山胡颓子 2.18 2.12 2.00 2.10 0.07 A 胡颓子科 胡颓子 2.62 2.95 3.15 2.91 0.19 A 葫芦科 绞股蓝 2.50 2.05 2.50 2.35 0.20 A 葫芦科 板栗 2.86 2.83 2.78 2.82 0.03 A 虎耳草科 土常山 2.16 2.00 2.10 2.09 0.06 A 虎耳草科 虎耳草 0.98 1.11 1.00 1.03 0.05 A 虎耳草科 山梅花 1.93 1.70 2.05 1.89 0.13 A 夹竹桃科 络石 1.58 2.50 3.06 2.38 0.53 A 金粟兰科 金粟兰 1.04 1.30 1.30 1.22 0.12 A 旌节花科 旌节花 1.52 1.50 1.45 1.49 0.03 A 菊科 三脉叶马兰 2.41 2.42 2.92 2.58 0.22 A 菊科 奇蒿 2.50 2.22 2.22 2.31 0.12 A 菊科 金鸡菊 9.50 9.70 8.88 9.36 0.32 A 菊科 香丝草 12.50 12.38 13.71 12.86 0.57 A 爵床科 九头狮子草 2.38 2.38 2.50 2.42 0.06 A 壳斗科 苦槠 2.21 2.30 2.23 2.25 0.03 A 壳斗科 麻栎 2.78 2.33 2.42 2.51 0.18 A 苦木科 臭椿 2.55 2.59 2.79 2.64 0.10 A 蓼科 虎杖 1.61 1.55 1.40 1.52 0.08 A 马鞭草科 紫珠 2.13 2.13 2.28 2.18 0.07 A 马钱科 醉鱼草 2.35 2.44 2.25 2.35 0.06 A 漆树科 黄连木 3.75 2.94 4.12 3.60 0.44 A 漆树科 盐肤木 2.11 2.00 2.05 2.05 0.04 A 荨麻科 苎麻 1.55 1.50 1.47 1.51 0.03 A 荨麻科 楼梯草 2.67 2.00 2.44 2.37 0.25 A 茜草科 六月雪 1.50 2.12 2.46 2.03 0.35 A 伞形科 鸭脚芹 1.35 1.16 1.15 1.22 0.09 A 桑科 薜荔 1.45 1.45 1.12 1.34 0.15 A 商陆科 美洲商陆 1.75 1.82 1.54 1.70 0.11 A 省沽油科 野鸭椿 1.45 1.41 1.96 1.60 0.24 A 透骨草科 透骨草 1.55 1.50 1.90 1.65 0.17 A 卫矛科 丝棉木 1.33 1.25 1.22 1.27 0.04 A 苋科 牛膝 2.00 2.00 2.19 2.06 0.08 A 榆科 糙叶树 2.23 1.67 1.62 1.84 0.26 A 樟科 狭叶山胡椒 2.70 2.71 1.84 2.42 0.38 A 樟科 山胡椒 2.29 2.17 2.25 2.23 0.04 A 樟科 天目木姜子 1.37 1.42 1.75 1.51 0.16 A 樟科 紫楠 3.22 2.43 2.68 2.78 0.30 B 禾本科 疏花雀麦 31.64 50.14 47.75 43.18 7.69 B 禾本科 求米草 2.82 2.75 2.78 2.78 0.02 B 禾本科 五节芒 29.65 25.26 29.16 28.02 1.84 B 禾本科 淡竹叶 11.33 9.74 12.00 11.02 0.86 B 禾本科 芒属某种 27.92 29.09 22.80 26.60 2.54 B 禾本科 狗尾草 15.00 16.60 15.00 15.53 0.71 B 禾本科 缩箬 5.00 8.60 4.67 6.09 1.67 B 禾本科 柳叶箬 5.33 5.93 5.73 5.67 0.22 B 鸭跖草科 鸭跖草 4.40 4.78 4.36 4.51 0.18 B 棕榈科 棕榈 9.82 9.88 13.50 11.06 1.62 B 百合科 菝葜 1.30 1.41 1.49 1.40 0.06 B 百合科 油点草 2.27 2.18 2.30 2.25 0.05 B 荨麻科 糯米团 3.48 2.80 2.31 2.86 0.41 B 荨麻科 冷水花 1.58 1.55 1.31 1.48 0.11 表中叶脉类型用符号表示,A 表示网状脉,B 表示平行或弧 形脉。由于平行脉与弧形脉的拓扑结构一致,所以并作一类。 结果与分析 首先,下图表明了两个性状分布的总体情况。 图中,纵坐标是 35 个科,横坐标表示长轴与短轴比例(以 下简称长短比)的分布。黑色条形表示测量得网状脉的长短之比 范围,白色条形表示测量得平行与弧状脉的长短之比范围。红线
Rubias电ae Ulmaceae 三 Major axis/ Minor axis Species with Reticular Nervure Species with Parallel Nervure Dicotyledonous Average Theoretical Critical Value ofthe Two Types of Nervure 是由双子叶植物每个科长短比的平均值连接而成,而蓝线是由单 子叶平均值连成。此图概括了我们测量结果的所有信息,并可以 从中看出一些规律 第一,黑色条形集中在红线附近,而白色条形集中在蓝线附 近,说明单子叶植物多平行或弧形脉,而双子叶植物多网状脉。30.00 这一点早有植物学家发现,我们只是又证明了其正确性,同时也200 说明我们采的这么多科还是较有代表性,且符合总体分布规律 第二,黑色条形集中在横坐标为1.00-500的区间内,而白1000 色条形广布于整个区间,并在1000以上处较密集。这说明了对00 两种类型的叶脉,叶形的变异程度不同。平行或弧形脉的叶形变总平均值为1160,标准差为1262。首先,做F测验,过程如下 异显然大于网状脉 第三,我们分别考察了网状脉和平行或弧形脉的叶形的平均 F=0B/0A=1262/186=678 而dfA=51,dfB=13时的临界值Fa0=250,所以标准差差 A Average 异极显著。B类的叶形变异大 再进行t测验 t=5.00 而dfA=51,d6B=13时的临界值tao01=266,所以平均值 差异极显著 这就说明,网状脉和平行或弧形脉的叶形差异是极显著的, 即两者存在相关性,且与参考文献[]理论计算结果一致 第四,我们考察了一下参考文献[1中提到的一个量化结论 值和标准差。它们分别可以用下图表 就输运效率考虑,叶脉类型A在长宽比小于42时占优势,B在 其中,A型各种总平均值为238,标准差为186;B型各种大于42时占优势,42是临界转变点。图中绿线即为42。很明 显,黑色条形集中于线左侧,白色条形集中于线右侧。所以,实
是由双子叶植物每个科长短比的平均值连接而成,而蓝线是由单 子叶平均值连成。此图概括了我们测量结果的所有信息,并可以 从中看出一些规律。 第一,黑色条形集中在红线附近,而白色条形集中在蓝线附 近,说明单子叶植物多平行或弧形脉,而双子叶植物多网状脉。 这一点早有植物学家发现,我们只是又证明了其正确性,同时也 说明我们采的这么多科还是较有代表性,且符合总体分布规律的。 第二,黑色条形集中在横坐标为 1.00~5.00 的区间内,而白 色条形广布于整个区间,并在 10.00 以上处较密集。这说明了对 两种类型的叶脉,叶形的变异程度不同。平行或弧形脉的叶形变 异显然大于网状脉。 第三,我们分别考察了网状脉和平行或弧形脉的叶形的平均 值和标准差。它们分别可以用下图表示: 其中,A 型各种总平均值为 2.38,标准差为 1.86;B 型各种 总平均值为 11.60,标准差为 12.62。首先,做 F 测验,过程如下: H0: σA=σB; HA: σA≠σB. F =σB/σA= 12.62/1.86 = 6.78 而 dfA = 51,dfB = 13 时的临界值 F0.01 = 2.50,所以标准差差 异极显著。B 类的叶形变异大。 再进行 t 测验: H0: μA=μB; HA: μA≠μB. t = 5.00 而 dfA = 51,dfB = 13 时的临界值 t 双 0.01 = 2.66,所以平均值 差异极显著。 这就说明,网状脉和平行或弧形脉的叶形差异是极显著的, 即两者存在相关性,且与参考文献[1]理论计算结果一致。 第四,我们考察了一下参考文献[1]中提到的一个量化结论: 就输运效率考虑,叶脉类型 A 在长宽比小于 4.2 时占优势, B 在 大于 4.2 时占优势,4.2 是临界转变点。图中绿线即为 4.2。很明 显,黑色条形集中于线左侧,白色条形集中于线右侧。所以,实 A Average 0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50 B Average 0.00 10.00 20.00 30.00 40.00 50.00 60.00
测的临界点与理论计算值十分一致。此外,下图所示的是测量得 然而,统计上可行不能说明对每一个个体均可行。我们不能 到的两种脉型的总体分布(横轴取对数标度),理论转变点42也忽略这个仿生学模型的局限,在运用它是应注意下面几点 在图中画出。可以清楚地看到,两总体分布的主要部分分居理论1.这种仿生应限制在“大脉”上,细微的叶脉结构受其它因素 变点的两侧 影响程度太大 2.应避免使用叶脉所起支撑作用不可忽略的叶子。这一点可以 讨论 通过叶片的质材、大小来考察。一般说来,对质地较硬、中 等大小的叶片,叶脉主要起营养输运功能 3.此方法不能完全替代计算机运算,得出结果一定要检验。 总结与展望 我们的工作证明了叶脉与叶形有极显著的相关性,且与营养 输运效率有关。这种相关性一定有其进化原因,我们只是提出了 一些猜测。更深入的原因应从基因分析得到。 就仿生学应用来说,参考文献[]的方法是可以的,只是要注 意一些限制。另外,叶脉的支撑功能也许也可以有仿生学应用前 Major Axis Minos Ads 根据以上分析,我们发现两个新结论 除仿生学运用外,叶脉的输运效率表示了其对叶形的适应程 结论一:B类叶的叶形变异程度远大于A类叶(极显著水平),度,用它结合叶形可以构系统发育树 就相对变异度来说,也是B大于A:我们认为B类叶大多属于单 子叶植物,在进化上的地位比较低等,所以总体来说,关于叶形 参考书籍与文献 的遗传信息较少,变异也就较大。另外,我们可以看出,同样的鲁伯埙,“叶脉脉序与资源输运模式”,《数学的实践与认 叶脉类型中,叶形都有较大程度变异,A类的叶形变异度为0.78, 识》,Vol132,No,2,中国数学会 B为109。我们认为这可能是叶脉的进化相对叶形滞后引起。叶[2]顾惠娟,《生物统计学》,复旦大学遗传和遗传工程系, 脉的形状相对复杂,所需遗传信息较多,改变需要更多的突变 2002.1。 也就需要更多的时间。这样,叶脉进化滞后于叶形,而存在一个B3]杨继、郭友好、杨雄、饶广远,《植物生物学》,高等教育 叶脉适应叶形的过程。如果决定这种适应过程的主要因素是营养 出版社& Springer-Verlag,19997 输运的效率,则以叶脉作为资源输运模式就有其意义 []徐荣章,《天目山木本植物图鉴》,中国林业出版社, 结论二:叶脉与叶形有极显著水平的相关性。就我们的实验⑤]冯志坚等,《植物学野外实习手册》,上海教育出版社,1993 来说,这种相关性表现为:A型脉的叶片长宽比较B型脉的叶片 显要小 这一点的形成应该有其进化原因。参考文献[提出的进化动 力是资源输运效率最大化。而实际的进化动力应该有多种,包括 叶脉的支撑功能,叶脉所受周围气孔等特殊结构的影响,叶脉对 叶片三维结构而非二维的适应等。但是,我们的统计结论说明 不同叶脉的叶形分布有显著不同,而且符合进化动力是资源输运 效率最大化的假设。更重要的是,我们实际测得的A型脉向B型 脉转变的临界点为42,恰与参考文献]的理论计算 些均说明,大多数植物的叶脉的主要的进化动力是资源输运效率 这实际上说明了叶脉仿生学应用的可行性。参考文献[假设 营养输运功能为叶脉的主要功能,忽略了一些其它因素的影响 所以必然有一些反例。比如,我们在天目山上发现了不少植物的 叶脉侧向伸出叶缘,如麻栎( Quercus acutissima)的叶缘芒刺, 这就营养输运的效率来说是一种浪费,但是这种结构起到了很好 的支撑作用,因其形若伞骨一般。我们做的统计中,也有一些A 型叶脉的叶片长短轴之比很大(>12),而B型很小(<3)。但是, 我们上面对进化动力的分析说明大多数情况下营养输运效率是主 要因素。因此,以叶脉作为资源输运模式是可行的
测的临界点与理论计算值十分一致。此外,下图所示的是测量得 到的两种脉型的总体分布(横轴取对数标度),理论转变点 4.2 也 在图中画出。可以清楚地看到,两总体分布的主要部分分居理论 转变点的两侧。 讨论 根据以上分析,我们发现两个新结论: 结论一:B类叶的叶形变异程度远大于A类叶(极显著水平), 就相对变异度来说,也是 B 大于 A;我们认为 B 类叶大多属于单 子叶植物,在进化上的地位比较低等,所以总体来说,关于叶形 的遗传信息较少,变异也就较大。另外,我们可以看出,同样的 叶脉类型中,叶形都有较大程度变异,A 类的叶形变异度为 0.78, B 为 1.09。我们认为这可能是叶脉的进化相对叶形滞后引起。叶 脉的形状相对复杂,所需遗传信息较多,改变需要更多的突变, 也就需要更多的时间。这样,叶脉进化滞后于叶形,而存在一个 叶脉适应叶形的过程。如果决定这种适应过程的主要因素是营养 输运的效率,则以叶脉作为资源输运模式就有其意义。 结论二:叶脉与叶形有极显著水平的相关性。就我们的实验 来说,这种相关性表现为:A 型脉的叶片长宽比较 B 型脉的叶片 明显要小。 这一点的形成应该有其进化原因。参考文献[1]提出的进化动 力是资源输运效率最大化。而实际的进化动力应该有多种,包括 叶脉的支撑功能,叶脉所受周围气孔等特殊结构的影响,叶脉对 叶片三维结构而非二维的适应等。但是,我们的统计结论说明, 不同叶脉的叶形分布有显著不同,而且符合进化动力是资源输运 效率最大化的假设。更重要的是,我们实际测得的 A 型脉向 B 型 脉转变的临界点为 4.2,恰与参考文献[1]的理论计算一致。以上这 些均说明,大多数植物的叶脉的主要的进化动力是资源输运效率 最大化。 这实际上说明了叶脉仿生学应用的可行性。参考文献[1]假设 营养输运功能为叶脉的主要功能,忽略了一些其它因素的影响, 所以必然有一些反例。比如,我们在天目山上发现了不少植物的 叶脉侧向伸出叶缘,如麻栎(Quercus acutissima)的叶缘芒刺, 这就营养输运的效率来说是一种浪费,但是这种结构起到了很好 的支撑作用,因其形若伞骨一般。我们做的统计中,也有一些 A 型叶脉的叶片长短轴之比很大(>12),而 B 型很小(<3)。但是, 我们上面对进化动力的分析说明大多数情况下营养输运效率是主 要因素。因此,以叶脉作为资源输运模式是可行的。 然而,统计上可行不能说明对每一个个体均可行。我们不能 忽略这个仿生学模型的局限,在运用它是应注意下面几点: 1. 这种仿生应限制在“大脉”上,细微的叶脉结构受其它因素 影响程度太大。 2. 应避免使用叶脉所起支撑作用不可忽略的叶子。这一点可以 通过叶片的质材、大小来考察。一般说来,对质地较硬、中 等大小的叶片,叶脉主要起营养输运功能。 3. 此方法不能完全替代计算机运算,得出结果一定要检验。 总结与展望 我们的工作证明了叶脉与叶形有极显著的相关性,且与营养 输运效率有关。这种相关性一定有其进化原因,我们只是提出了 一些猜测。更深入的原因应从基因分析得到。 就仿生学应用来说,参考文献[1]的方法是可以的,只是要注 意一些限制。另外,叶脉的支撑功能也许也可以有仿生学应用前 景。 除仿生学运用外,叶脉的输运效率表示了其对叶形的适应程 度,用它结合叶形可以构系统发育树。 参考书籍与文献 [1] 鲁伯埙,“叶脉脉序与资源输运模式”,《数学的实践与认 识》,Vol.32,No.2,中国数学会。 [2] 顾惠娟,《生物统计学》,复旦大学遗传和遗传工程系, 2002.1。 [3] 杨继、郭友好、杨雄、饶广远,《植物生物学》,高等教育 出版社 & Springer-Verlag,1999.7。 [4] 徐荣章,《天目山木本植物图鉴》,中国林业出版社,1989。 [5] 冯志坚等,《植物学野外实习手册》,上海教育出版社,1993。 0.00 0.05 0.10 0.15 0.20 0.25 1.00 10.00 100.00 Major Axis / Minor Axis Frequency
蕨类植物茎轴几何形态的分类与进化 王昕张昊鲁伯埙 维管植物茎軸的几何形态发生与进化是一个有趣的问题。我们以西天目山和浙西大峡谷常见的蕨类植物为对象,通过 对采集到的14个种共计45个标本进行测量以及教量化和模型化分析,发现蕨类植物三大类群的维管轴几何形态具有显著 差别,并由此推论三大类群在形态发生上可能的进化关系。我们的方法与结论可能有助于对该类群植物标本与化石的鉴定 分类工作,也希望能为相关种系发生的进化研究提供另一种可能的思路。 蕨类植物( Ferns),即一般通称的蕨类植物门,是一类进化几何参数的获得与归一化 地位处于裸蕨植物和裸子植物之间的维管植物,曾兴盛于石炭纪除了一个标本([501])外,其余的都是具有主茎轴的羽状 和早二叠世,包括三个大类群:石松类、木贼类和真蕨类。它们叶结构或没有可见的次级茎轴体([06?】)。所以我们主要讨论具 都起源于早、中泥盆世的裸蕨植物,但它们的进化路线自泥盆纪有主茎轴的几何形态的处理,这也是我们进一步分析的基础 以后就彼此分离,因此是亲缘关系相当疏远的类群。现代的蕨类 从原始数据获得的未归一的参数用英文字母表示,具体意义 大都是草本植物,并且以三大类群中最为进化的真蕨纲为主。根参看图示说明(见图一)。未归一的参数都具有长度的量纲。 据其具有大型羽状复叶等特点,也将真蕨纲与裸子植物、被子植 物一道归为羽叶亚门( Pteropsida)2 有关维管植物的茎轴以及更为进化的形态单位(叶、根等) 的发生和起源,顶枝学说( Telome Theory)是自二十世纪初以 来被广泛承认的假说。该学说论述维管轴的分枝形态如何演进、 高级器官如何发生的规律口。我们进一步认为,进化过程中形态 发生模式的演化不仅从定性意义上,而且从定量意义上具有连续 性的特点。因此,信息量更大的定量模型应该能为种系发生研究 提供更精细的证据 我们认为,维管轴体的分枝形态与植物支撑结构、叶的排布 运输效率等重要生命因子相密切关联,因此其演进应该比植物的 其它几何形态要保守。蕨类植物三大类群的亲缘关系相当疏远 图一未归一几何参数的图解 用茎轴几何形态来研究其进化关系比较适合。 规定从主茎轴基端起第一个长出次级茎轴的分枝点为原点 记序数为0,由此往顶端递增。一般的序数记为i。 材料与方法 左右参数分开,并皆以下标L、R注明。记从分枝点i到原 标本的采集、鉴定与描述 点的距离为1,从分枝点i长出的次级茎轴长度为s记原点到主 在2002年7月8日至19日往浙江省天目山自然保护区的野茎轴顶端的距离为1-。另外,记相邻分枝点间距为△1 外考察过程中,共采集蕨类植物标本14种45个(详见表一)。采 A1=1-1 到的标本都是采集地点具有普遍性和代表性的物种 为了消除种内、种间个体大小造成的影响,我们将所得的参 表一采集到的标本信息 数归一化,亦即将以1作为单位,衡量所有未归一的参数所得的 标本数比定义为归一化的参数。经归一化的参数都是无量纲标量,以希 木贼类 腊字母表示。即 1 3 真蕨类 λ1=1/1(i=0,1,…) 主要采集目标个体在地面以上的完整部分,避免有严重缺损 1=s/l。(i=0,1,…) 的标本 △1=ΔL/1。(i=1,2,…) 依据文献和索引表对采集到的标本作尽可能详细的鉴定( 果见附录一)3。 将标本编号,以方括号内的四位数字表示,前两位为种编号 A∈[0,1(i=0,1,…) 后两位为该种内的标本编号。无论是种编号还是种内标本号都按 对归一化的数据,我们将进一步从中提取信息,以期发现三 照采集顺序排编,可以视为随机的。 大类群以至各个种在这些几何参数集上的特征性。我们通过各种 用刻度尺对各个标本的主茎轴长度、主茎轴上各相邻分枝点以曲线拟合为基础的相关分析来获得进一步信息。 间距以及主茎轴上生出的各次级茎轴的长度在刻度尺精度范围内MM1-i分析 进行测量。对于没有主茎的标本,仍测量其各相邻分枝点与轴端 将各标本的1和i作为应变量和自变量,以四次多项式函 点间的长度(见附录二)。 数f(x)=4x4+x+c2x2+cx+c0拟合左右合并的数据(结 果见附录三)
蕨类植物茎轴几何形态的分类与进化 王 昕 张 昊 鲁伯埙 维管植物茎轴的几何形态发生与进化是一个有趣的问题。我们以西天目山和浙西大峡谷常见的蕨类植物为对象,通过 对采集到的 14 个种共计 45 个标本进行测量以及数量化和模型化分析,发现蕨类植物三大类群的维管轴几何形态具有显著 差别,并由此推论三大类群在形态发生上可能的进化关系。我们的方法与结论可能有助于对该类群植物标本与化石的鉴定 分类工作,也希望能为相关种系发生的进化研究提供另一种可能的思路。 蕨类植物(Ferns),即一般通称的蕨类植物门,是一类进化 地位处于裸蕨植物和裸子植物之间的维管植物,曾兴盛于石炭纪 和早二叠世,包括三个大类群:石松类、木贼类和真蕨类。它们 都起源于早、中泥盆世的裸蕨植物,但它们的进化路线自泥盆纪 以后就彼此分离,因此是亲缘关系相当疏远的类群。现代的蕨类 大都是草本植物,并且以三大类群中最为进化的真蕨纲为主。根 据其具有大型羽状复叶等特点,也将真蕨纲与裸子植物、被子植 物一道归为羽叶亚门(Pteropsida)[1, 2]。 有关维管植物的茎轴以及更为进化的形态单位(叶、根等) 的发生和起源,顶枝学说(Telome Theory)是自二十世纪初以 来被广泛承认的假说。该学说论述维管轴的分枝形态如何演进、 高级器官如何发生的规律[1]。我们进一步认为,进化过程中形态 发生模式的演化不仅从定性意义上,而且从定量意义上具有连续 性的特点。因此,信息量更大的定量模型应该能为种系发生研究 提供更精细的证据。 我们认为,维管轴体的分枝形态与植物支撑结构、叶的排布、 运输效率等重要生命因子相密切关联,因此其演进应该比植物的 其它几何形态要保守。蕨类植物三大类群的亲缘关系相当疏远, 用茎轴几何形态来研究其进化关系比较适合。 材料与方法 标本的采集、鉴定与描述 在 2002 年 7 月8 日至 19 日往浙江省天目山自然保护区的野 外考察过程中,共采集蕨类植物标本 14 种 45 个(详见表一)。采 到的标本都是采集地点具有普遍性和代表性的物种。 表一 采集到的标本信息 类 群 种 数 标 本 数 石 松 类 2 11 木 贼 类 1 13 真 蕨 类 11 21 主要采集目标个体在地面以上的完整部分,避免有严重缺损 的标本。 依据文献和索引表对采集到的标本作尽可能详细的鉴定(结 果见附录一)[3]。 将标本编号,以方括号内的四位数字表示,前两位为种编号, 后两位为该种内的标本编号。无论是种编号还是种内标本号都按 照采集顺序排编,可以视为随机的。 用刻度尺对各个标本的主茎轴长度、主茎轴上各相邻分枝点 间距以及主茎轴上生出的各次级茎轴的长度在刻度尺精度范围内 进行测量。对于没有主茎的标本,仍测量其各相邻分枝点与轴端 点间的长度(见附录二)。 几何参数的获得与归一化 除了一个标本([0501])外,其余的都是具有主茎轴的羽状 叶结构或没有可见的次级茎轴体([06??])。所以我们主要讨论具 有主茎轴的几何形态的处理,这也是我们进一步分析的基础。 从原始数据获得的未归一的参数用英文字母表示,具体意义 参看图示说明(见图一)。未归一的参数都具有长度的量纲。 图一 未归一几何参数的图解 规定从主茎轴基端起第一个长出次级茎轴的分枝点为原点, 记序数为 0,由此往顶端递增。一般的序数记为 i。 左右参数分开,并皆以下标 L、R 注明。记从分枝点 i 到原 点的距离为 li,从分枝点 i 长出的次级茎轴长度为 si。记原点到主 茎轴顶端的距离为 l∞。另外,记相邻分枝点间距为Δli。 为了消除种内、种间个体大小造成的影响,我们将所得的参 数归一化,亦即将以 l∞作为单位,衡量所有未归一的参数所得的 比定义为归一化的参数。经归一化的参数都是无量纲标量,以希 腊字母表示。即 于是 (1) 对归一化的数据,我们将进一步从中提取信息,以期发现三 大类群以至各个种在这些几何参数集上的特征性。我们通过各种 以曲线拟合为基础的相关分析来获得进一步信息。 分析 将各标本的 和 i 作为应变量和自变量,以四次多项式函 数 拟合左右合并的数据(结 果见附录三)
我们获得了较高的相关度,并且高次项(3、4次)系数很小 (105-104量级)。因此可以认为,L1-i关系中以低次成分为 系数的有序数列(2c1Co是由标本几何参数决定的量,因此 是可以作为标本的几何形态指标。在系数空间c2-c1-c0中,我们 发现代表三大类群的数据点有明显的不同分布(见图二)。 图三AL-A1分析的系数空间 (a)c2-c1-co系数子空间:(b)c3-c2-c1系数子空 间。仍然沿用前图的颜色方案。可以看到,三大类群 的分离更加明显 A1-A1分析 图二ΔL1-i分析的c2-C1-c0系数空间 我们尝试将自变量换作入1来研究△1的变化规律,用三次多 其中红色点表示石松类,黄色点表示木贼类,蓝 项式函数f(x)=cx3+x2+qx+0拟合左右合并的数据。我 色点表示真蕨类。可以看到,三个类群的数据点具有 们获得了更高的相关度(见附录四)。 明显不同的分布 更为可喜的是,在系数空间c3-c2-c1-c0中,我们发现三大 另一个值得注意的特点是所有数据点具有极显著的相关性类群出现了更显著的分离(见图三) (见表二)。换句话说,数据点在系数空间排列在一直线周围 三大类群散点分布的相关度并不太高,尤其是次数相隔较远 表二L1-i分析诸系数的偏相关系数 的系数之间(见表三),这说明由此中方法得到的信息量更大。 表三A-分析诸系数的偏相关系数 0.9369 由此线性拟合所有数据点,得方程 0.9148* 0018003600291 G1-1分析 以上的两种方法都没有使用次级茎轴长度数据,而这种分析 方法将探究次级茎轴的长度1与其着生位置λ1的关系的规律性。 由于我们采集了木贼的营养枝,生于其主茎轴上的次级形态单位 退化,因而无法得到σ1,故此方法仅分析石松类和真蕨类 由于次级茎轴随着着生位置向顶端接近而逐渐减小,并且到 顶端处缩为一点。因此我们可以确信,G-λ曲线必定过点 (1,0)。所以我们用来拟合Gr1-1数据的函数为 f(x)=c4(x-1)+c(x-1)+c2(x-1)+c1(x-1) 所有的数据都相当好的配合了这族曲线(见附录五)。但从 系数空间看,两大类群并没有非常显著的分离。然而,在c4-C3-c2 c1系数空间中的所有点却非常好的呈线性相关关系(见图四) 表四G-A分析诸系数的偏相关系数 0.9445 0.9792 0.8347 0.8931 0.9601 线性拟合所有数据点,得到方程
我们获得了较高的相关度,并且高次项(3、4 次)系数很小 (10-5 – 10-4量级)。因此可以认为, 关系中以低次成分为 主。 系数的有序数列(c2, c1, c0)是由标本几何参数决定的量,因此 是可以作为标本的几何形态指标。在系数空间 c2 - c1 - c0中,我们 发现代表三大类群的数据点有明显的不同分布(见图二)。 图二 分析的 c2 - c1 - c0系数空间 其中红色点表示石松类,黄色点表示木贼类,蓝 色点表示真蕨类。可以看到,三个类群的数据点具有 明显不同的分布 另一个值得注意的特点是所有数据点具有极显著的相关性 (见表二)。换句话说,数据点在系数空间排列在一直线周围。 表二 分析诸系数的偏相关系数 r c2 c1 c1 0.9556** c0 0.8306** 0.9371** 由此线性拟合所有数据点,得方程 (2) 图三 分析的系数空间 (a) c2 - c1 - c0系数子空间;(b) c3 – c2 – c1系数子空 间。仍然沿用前图的颜色方案。可以看到,三大类群 的分离更加明显。 分析 我们尝试将自变量换作 来研究 的变化规律,用三次多 项式函数 拟合左右合并的数据。我 们获得了更高的相关度(见附录四)。 更为可喜的是,在系数空间 c3 - c2 - c1 - c0中,我们发现三大 类群出现了更显著的分离(见图三)。 三大类群散点分布的相关度并不太高,尤其是次数相隔较远 的系数之间(见表三),这说明由此中方法得到的信息量更大。 表三 分析诸系数的偏相关系数 r c3 c2 c 1 c2 0.9369** c1 0.7968** 0.9148** c0 0.2917 0.3666* 0.6646** 分析 以上的两种方法都没有使用次级茎轴长度数据,而这种分析 方法将探究次级茎轴的长度 与其着生位置 的关系的规律性。 由于我们采集了木贼的营养枝,生于其主茎轴上的次级形态单位 退化,因而无法得到 ,故此方法仅分析石松类和真蕨类。 由于次级茎轴随着着生位置向顶端接近而逐渐减小,并且到 顶端处缩为一点。因此我们可以确信, 曲线必定过点 。所以我们用来拟合 数据的函数为 所有的数据都相当好的配合了这族曲线(见附录五)。但从 系数空间看,两大类群并没有非常显著的分离。然而,在 c4 - c3 - c2 - c1系数空间中的所有点却非常好的呈线性相关关系(见图四)。 表四 分析诸系数的偏相关系数 r c4 c3 c1 c3 0.9909** c2 0.9445** 0.9792** c1 0.8347** 0.8931** 0.9601** 线性拟合所有数据点,得到方程
c3 00690.0790.0990.1441 00500 a) 00s00 00100 06000 08000 10000 图五△14+1-△分析的a-b系数空间 仍然沿用前图的颜色方案。可以看到,三大类群 也有明显分离,且所有数据点呈极显著线性相关 D分析 这种分析方法源于分形几何学( Fractal Geometry)对自然 形状的看法。植物的形态往往被认为是一种自相似的几何结构 因而具有大于其拓扑维数D1的分维数,即 Hausdorff-Besicovitch 维 然D是一个分形几何结构的属性参数,那么对于具有自相 似分形结构的植物形态,D就可以作为一个分类指标 当然在我们所观察到的蕨类植物维管轴体形态中,很少有严 格自相似的,往往是次级的形态发生与初级的形态有比较大的差 别。但在这里,我们必须忽略这种差别,并将测量得到的主茎轴 上的初级形态发生作为生成子( Generator)应用到整株植物上去 虽然由此得到的严格自相似形态与真实自然形态可能截然不同 但我们相信,至少在一定程度上,我们获得了该株植物的几何形 态特征。 除了上述的忽略之外,我们还需作一个二维近似。真实的植 物形态自然是三维的,但为了方便测量和分析,我们将其视为 维的,换句话说,我们研究的是标本在标本夹内压过以后的形态 或是自然形态在纸上的投影。 图四ar-A1分析的系数空间 具有如图一的羽状迭代结构的分形茎轴体的D值实际上就 (a)c3-c2-c1系数子空间:(b)c-c3-c2系数子空 是方程 间。仍然沿用前图的颜色方案。可以看到,两大类群 未能明显分离,且所有数据点呈极显著线性相关 A4+1-△分析 的解。实际计算时,我们将茎轴顶端由于过于细小而无法测量 △+1-△也是一种可能的分析方法。我们仍用左右合并的的小段视为一个次级初始子( Secondary Initiator),就如同一般 数据。鉴于A+1-△数据具有较好的线性,我们用线性函数的次级茎轴一样处理(结果见附录七)。由于和σ-l分析一样 f(x)=a+bx拟合(见附录六)。 的原因,只能处理石松、真蕨两大类群的数据 所得的a-b空间中,数据点仍呈显著线性分布(见图五), 由测量得到的迭代模式不是自回避的,因此大多数的D值都 相关系数为09449*。线性拟合所得到的散点分布,得方程 大于2也是很正常的。 假设D值总体服从正态分布,由此从所得D值样本分布推 006910.8736 断总体分布(见图六)。石松类的D均值略大于真蕨类,但两者 以看到,三大类群也有较明显的分离,并且分离模式与根本没有显著差异。所以在此意义上D可能并不是一个好的分类 △4-i分析几乎完全相同 指标
(3) 图四 分析的系数空间 (a) c3 – c2 – c1系数子空间;(b) c4 – c3 – c2 系数子空 间。仍然沿用前图的颜色方案。可以看到,两大类群 未能明显分离,且所有数据点呈极显著线性相关。 分析 也是一种可能的分析方法。我们仍用左右合并的 数据。鉴于 数据具有较好的线性,我们用线性函数 拟合(见附录六)。 所得的 a – b 空间中,数据点仍呈显著线性分布(见图五), 相关系数为 0.9449**。线性拟合所得到的散点分布,得方程 (4) 可以看到,三大类群也有较明显的分离,并且分离模式与 分析几乎完全相同。 图五 分析的 a – b 系数空间 仍然沿用前图的颜色方案。可以看到,三大类群 也有明显分离,且所有数据点呈极显著线性相关。 D 分析 这种分析方法源于分形几何学(Fractal Geometry)对自然 形状的看法。植物的形态往往被认为是一种自相似的几何结构, 因而具有大于其拓扑维数 DT 的分维数,即 Hausdorff-Besicovitch 维 D[4]。 既然 D 是一个分形几何结构的属性参数,那么对于具有自相 似分形结构的植物形态,D 就可以作为一个分类指标。 当然在我们所观察到的蕨类植物维管轴体形态中,很少有严 格自相似的,往往是次级的形态发生与初级的形态有比较大的差 别。但在这里,我们必须忽略这种差别,并将测量得到的主茎轴 上的初级形态发生作为生成子(Generator)应用到整株植物上去, 虽然由此得到的严格自相似形态与真实自然形态可能截然不同, 但我们相信,至少在一定程度上,我们获得了该株植物的几何形 态特征。 除了上述的忽略之外,我们还需作一个二维近似。真实的植 物形态自然是三维的,但为了方便测量和分析,我们将其视为二 维的,换句话说,我们研究的是标本在标本夹内压过以后的形态, 或是自然形态在纸上的投影。 具有如图一的羽状迭代结构的分形茎轴体的 D 值实际上就 是方程 (5) 的解[4]。实际计算时,我们将茎轴顶端由于过于细小而无法测量 的小段视为一个次级初始子(Secondary Initiator),就如同一般 的次级茎轴一样处理(结果见附录七)。由于和 分析一样 的原因,只能处理石松、真蕨两大类群的数据。 由测量得到的迭代模式不是自回避的,因此大多数的 D 值都 大于 2 也是很正常的。 假设 D 值总体服从正态分布,由此从所得 D 值样本分布推 断总体分布(见图六)。石松类的 D 均值略大于真蕨类,但两者 根本没有显著差异。所以在此意义上 D 可能并不是一个好的分类 指标
式。不过这里我们仍然对已有的有限数据进行分析 由于系数空间内不同的种有分离,可以用系数空间内的欧氏 距离 进行聚类分析 另外,我们考虑到式(1),即Δ-分析和a-A分析中 从每个标本的数据抽提得到的特征是一个定义在0,1上的连续函 数f1(x):[0,1→R(其中p为标本总编号),所以考虑用如下的 距离定义描述两个标本的几何差异: Haus dorff-Resicovtch Dimension dpq=l ifp(x)-fg(x)Idx 图六正态假设下推断的石松、真蕨两大类群的D总体分布 仍然沿用前图的颜色方案。可以看到,两推断总 (dr≥0(p,q; 体分布没有显著差异。 以上的dp满足(mdp=d学(YPq 人工神经网络分类器的分类分析 (md +d 2 dp(vp, q, r). 除了统计分析外,所得分类指标分离程度的好坏还能直观地 因此dp是严格意义上的距离函数 用诸如人工神经网络等学习算法在相同技术参数下用同一组数据 我们将由距离公式(6进行聚类分析的方法称为欧氏系数空 训练相同次数后的分类表现(成功率)来衡量。简单的神经网络间法(ESOC, Euclidean Space of Coefficients):将由距离公式 就可以完成我们所要进行的分类56。 (刁)计算的方法称为形状匹配法(SF, Shape-Fitting) 我们采用两层前传的简单网络,输入层具有与系数空间维数 图七是我们进行聚类分析的结果。我们用如下的符号: 相同数目的输入单元,隐藏层神经元数为固定值,输出层神经元 Iree(数据来源的分析方法,距离方法,构树方法) 数为3,也就是OU数目,代表三大类群。网络中所有神经元都来表征一个树谱图的参数和技术特征 是略有改动的 McCulloch-Pitt形式神经元。初始连接权重矩阵由 [01? 均匀分布的随机函数生成。用一种方法所得的所有系数列数据对 该网络进行训练,采用结合了模拟退火算法进行最速下降法求极 值的 Back-Propagation算法进行权重矩阵优化(具体的网络、算 法技术细节见附录八)。 对于1-i分析、△1-分析和△41-△分析,训练 次后,发现该网络在某些初始值下已能正确识别过半数的标本 而其它分离不充分的分析方法的训练效果不佳 结果与讨论 数量形态分类 从以上各种分析我们可以得出结论:现代蕨类植物三大类群 的孢子体维管轴几何形态发生具有可区分的差异。更进一步,我 们发现尤其与主茎轴有关的形态发生规律(4-i、L2-1和 Δ+41-L)差别显著性更高。此外,真蕨类中诸多种属也有分 离,但由于我们采集的数据有限,未能进行更细致的分类 对于我们提出的一种新的分析方式D分析,虽然没有发 现两大类群的D值显著差异,但某些迹象与我们的观察一致。比 如说,两种卷柏的D均值比真蕨D均值略大,实际上我们看到的 [01? 柏往往形态更细致复杂,因此其分维数大是不奇怪的。由此 我们认为,两大类群的D值总体是不同的总体,只是由于我们数 据量有限而无法发现其差别。当然,D值作为分类指标就不令人 满意了,因为它可能要求大规模样本,敏感性太低 更为细致的聚类分析 如果进一步深入到三大类群中的科属的几何形态分类,恐怕 我们得到的数据量不够:很多种只采过一个标本,无法通过平均 求得其在系数空间内较为准确的位置。但我们相信,如果数据量 足够的话,就很可能可以得到类群内更为精细的几何形态差别模
图六 正态假设下推断的石松、真蕨两大类群的 D 总体分布 仍然沿用前图的颜色方案。可以看到,两推断总 体分布没有显著差异。 人工神经网络分类器的分类分析 除了统计分析外,所得分类指标分离程度的好坏还能直观地 用诸如人工神经网络等学习算法在相同技术参数下用同一组数据 训练相同次数后的分类表现(成功率)来衡量。简单的神经网络 就可以完成我们所要进行的分类[5, 6]。 我们采用两层前传的简单网络,输入层具有与系数空间维数 相同数目的输入单元,隐藏层神经元数为固定值,输出层神经元 数为 3,也就是 OTU 数目,代表三大类群。网络中所有神经元都 是略有改动的 McCulloch-Pitts 形式神经元。初始连接权重矩阵由 均匀分布的随机函数生成。用一种方法所得的所有系数列数据对 该网络进行训练,采用结合了模拟退火算法进行最速下降法求极 值的 Back-Propagation 算法进行权重矩阵优化(具体的网络、算 法技术细节见附录八)。 对于 分析、 分析和 分析,训练 一次后,发现该网络在某些初始值下已能正确识别过半数的标本; 而其它分离不充分的分析方法的训练效果不佳。 结果与讨论 数量形态分类 从以上各种分析我们可以得出结论:现代蕨类植物三大类群 的孢子体维管轴几何形态发生具有可区分的差异。更进一步,我 们发现尤其与主茎轴有关的形态发生规律( 、 和 )差别显著性更高。此外,真蕨类中诸多种属也有分 离,但由于我们采集的数据有限,未能进行更细致的分类。 对于我们提出的一种新的分析方式— — D 分析,虽然没有发 现两大类群的 D 值显著差异,但某些迹象与我们的观察一致。比 如说,两种卷柏的 D 均值比真蕨 D 均值略大,实际上我们看到的 卷柏往往形态更细致复杂,因此其分维数大是不奇怪的。由此, 我们认为,两大类群的 D 值总体是不同的总体,只是由于我们数 据量有限而无法发现其差别。当然,D 值作为分类指标就不令人 满意了,因为它可能要求大规模样本,敏感性太低。 更为细致的聚类分析 如果进一步深入到三大类群中的科属的几何形态分类,恐怕 我们得到的数据量不够:很多种只采过一个标本,无法通过平均 求得其在系数空间内较为准确的位置。但我们相信,如果数据量 足够的话,就很可能可以得到类群内更为精细的几何形态差别模 式。不过这里我们仍然对已有的有限数据进行分析。 由于系数空间内不同的种有分离,可以用系数空间内的欧氏 距离 (6) 进行聚类分析。 另外,我们考虑到式(1),即 分析和 分析中 从每个标本的数据抽提得到的特征是一个定义在[0, 1]上的连续函 数 (其中 p 为标本总编号),所以考虑用如下的 距离定义描述两个标本的几何差异: (7) 以上的 满足 (8) 因此 是严格意义上的距离函数。 我们将由距离公式(6)进行聚类分析的方法称为欧氏系数空 间法(ESOC,Euclidean Space of Coefficients);将由距离公式 (7)计算的方法称为形状匹配法(SF,Shape-Fitting)。 图七是我们进行聚类分析的结果。我们用如下的符号: Tree(数据来源的分析方法, 距离方法, 构树方法) 来表征一个树谱图的参数和技术特征
03?2 j-1 k-1 其中i为类群标号,j为类群中的种标号,k为种中标本标号:N1 为类群i中种数目,n为类群i的种j中标本的数目。 由此公式分别计算Δ1-i分析、LL-2分析和 A+1-L分析中系数空间内三大类群的平均位置,再计算两两 之间的欧氏距离d=Xp-X4 [01? 真蕨类 木贼类 石松类 真蕨类 木贼类 ·石松类 真蕨类 木贼类一 石松类 图八三大类群中心点在主茎轴分析的系数空间中的相对位置 (a)△4-i分析的系数空间;()△1-A分析 的系数空间;()△+1-△L分析的系数空间。三个图 都按保距保角的原则画出 是Δ+1-A分析,木贼类和真蕨类的距离都是最近的,木贼类 1? 和石松类的距离最远,石松类和真蕨类的距离居中(见图八)。 如果在我们所得的系数空间内用欧氏距离法进行演化推断 的话,无论三种主茎轴分析中的哪一种都支持如图九所示的种系 图七聚类分析所得的树谱图 发生模式 (a)Tree(4-i, ESOC, UPGMA) (b)Tree(Al -Ai, ESOC, UPGMA) 木贼类 石松类 (c) Tree(Al-M, SF, UPGMA (d)Tree(a-A, ESOC, UPGMA) (e) Tree(Oi-Ai, SF, UPGMA): (f)Tre(△+1-△,ESOC, UPGMA) 从聚类分析的结果来看,不同的数据来源、不同的距离函数 图九由主茎轴分析系数空间的距离推断的种系发生模式 树谱图:也就是说,主茎轴模式我们得到的结论与经典的化石研究的结论是一致的 和次级茎轴模式、EsOC距离和s距离都将对同一个测试种集合证据表明,早泥盆世时主要的植物类型是裸蕨类。在其初的惹丁 产生不同的聚类模式。这说明我们的数据具有很大的信息量 期,已经同时生长着瑞尼蕨型和工蕨型两种类型的裸蕨植物。到 按照我们的方法进行几何参数采集可以将不同种的蕨类植物从几稍后的西根期,已经有不少原始石松类的种类出现:而原始木贼 何形态上区分开,亦即用以上不同的方法可以较为成功地进行鉴类和真蕨类的初生蕨亚纲至少到中泥盆世才出现。因此,三类化 定。可以想见仅仅通过几何参数测量进行分类工作的可能性。 石出现的时间支持我们的结论。 三大类群种系发生与进化的推断 另外,我们的结论也支持比较公认的蕨类植物进化途径(见 我们认为三大类群在主茎轴分析(Δ-i分析、Δ1-λ2图十):“志留纪末期某种绿藻的后裔登陆,产生了裸蕨植物。” 分析和Δ1-Δλ分析)的系数空间中的欧氏距离能够作为衡量“在早泥盆世初的惹丁期,陆生维管植物主要循着以裸蕨植物中 其在茎轴形态发生上的亲缘关系的量。因此可以通过获得各OnU的瑞尼蕨型和工蕨型为代表的两条演化路线发展。到稍后的西根 在系数空间的距离矩阵来进行系统发育分析。 期,工蕨型植物发生了一次多方向的演变,产生了许多原始石松 首先考虑三大类群在系数空间的位置。为了去除不同标本类,其中一部分便成了现代石松类的远祖。同一时期,脱胎于瑞 数、种数的影响,我们采用如下的平均公式计算每一类群的中心尼蕨型的裸蕨型植物,也起了向其它维管植物演进的桥梁作用。 坐标 到早泥盆世末或中泥盆世初的阶段,似乎发生过一次主要以裸蕨
图七 聚类分析所得的树谱图 (a) Tree( , ESOC, UPGMA); (b) Tree( , ESOC, UPGMA); (c) Tree( , SF, UPGMA); (d) Tree( , ESOC, UPGMA); (e) Tree( , SF, UPGMA); (f) Tree( , ESOC, UPGMA); 从聚类分析的结果来看,不同的数据来源、不同的距离函数 导致了具有完全不同拓扑结构的树谱图;也就是说,主茎轴模式 和次级茎轴模式、ESOC 距离和 SF 距离都将对同一个测试种集合 产生不同的聚类模式。这说明我们的数据具有很大的信息量— — 按照我们的方法进行几何参数采集可以将不同种的蕨类植物从几 何形态上区分开,亦即用以上不同的方法可以较为成功地进行鉴 定。可以想见仅仅通过几何参数测量进行分类工作的可能性。 三大类群种系发生与进化的推断 我们认为三大类群在主茎轴分析( 分析、 分析和 分析)的系数空间中的欧氏距离能够作为衡量 其在茎轴形态发生上的亲缘关系的量。因此可以通过获得各 OTU 在系数空间的距离矩阵来进行系统发育分析。 首先考虑三大类群在系数空间的位置。为了去除不同标本 数、种数的影响,我们采用如下的平均公式计算每一类群的中心 坐标: (9) 其中 i 为类群标号,j 为类群中的种标号,k 为种中标本标号; 为类群 i 中种数目, 为类群 i 的种 j 中标本的数目。 由此公式分别计算 分 析 、 分析和 分析中系数空间内三大类群的平均位置,再计算两两 之间的欧氏距离 。 图八 三大类群中心点在主茎轴分析的系数空间中的相对位置 (a) 分析的系数空间;(b) 分析 的系数空间;(c) 分析的系数空间。三个图 都按保距保角的原则画出。 从得到的数据来看,无论是 分析、 分析还 是 分析,木贼类和真蕨类的距离都是最近的,木贼类 和石松类的距离最远,石松类和真蕨类的距离居中(见图八)。 如果在我们所得的系数空间内用欧氏距离法进行演化推断 的话,无论三种主茎轴分析中的哪一种都支持如图九所示的种系 发生模式。 图九 由主茎轴分析系数空间的距离推断的种系发生模式 我们得到的结论与经典的化石研究的结论是一致的[1]。化石 证据表明,早泥盆世时主要的植物类型是裸蕨类。在其初的惹丁 期,已经同时生长着瑞尼蕨型和工蕨型两种类型的裸蕨植物。到 稍后的西根期,已经有不少原始石松类的种类出现;而原始木贼 类和真蕨类的初生蕨亚纲至少到中泥盆世才出现。因此,三类化 石出现的时间支持我们的结论。 另外,我们的结论也支持比较公认的蕨类植物进化途径[1](见 图十):“志留纪末期某种绿藻的后裔登陆,产生了裸蕨植物。” “在早泥盆世初的惹丁期,陆生维管植物主要循着以裸蕨植物中 的瑞尼蕨型和工蕨型为代表的两条演化路线发展。到稍后的西根 期,工蕨型植物发生了一次多方向的演变,产生了许多原始石松 类,其中一部分便成了现代石松类的远祖。同一时期,脱胎于瑞 尼蕨型的裸蕨型植物,也起了向其它维管植物演进的桥梁作用。 到早泥盆世末或中泥盆世初的阶段,似乎发生过一次主要以裸蕨