《数据科学导论》 北京中医荔大等 D%B方博O罐s 大数据概述 管理学院唐燕 BIG DATA
大数据概述 《数据科学导论》 管理学院 唐燕
提纲 北京中医荔大亭 D%B市博O罐 1.大数据时代 2.大数据概念 3.大数据的影响 4.大数据的应用 5.大数据关键技术 6.大数据计算模式 7.大数据产业 8.大数据与云计算、物联网的关系 9.大数据在中医药及生物医学领域的应用
提纲 1. 大数据时代 2. 大数据概念 3. 大数据的影响 4. 大数据的应用 5. 大数据关键技术 6. 大数据计算模式 7. 大数据产业 8. 大数据与云计算、物联网的关系 9. 大数据在中医药及生物医学领域的应用
1.大数据时代 北京中医荔大等 D%B方牌O罐d 第三次 浪潮 BIG 大数据时代 黄】阿尔文·托夫勒著 INFORMATION 一蜂几代人指闭末来方食的不钙经肉 DATA A REVOLUTION型光 特使地植二十有,巴成三千净种青 COMPLEX DATARA密STORAG正E 金发行上千开当 大数据时代 生活、工作与思维的大变革 专4弘蜗纳 B工S DAF☑
1.大数据时代
什么是数据? 北京中医荔大等 D%B方牌O罐dd 原始数据点 例如: 数据 数字、文字、图片、视频等 -100万( 没有任何 意义) 某公司今 年的利润 有价值的数据集合 100万(包 息 具有特定的意义 含的信息 ,亏损) 让智慧决策触手可及 该公司今 知 可为决策提供依据 年亏损, 识 具有可破译性、关联性、新 我不能买 颖性和价值性的加工后信息 该公司的 股票
什么是数据? 数 据 信 息 知 识 原始数据点 数字、文字、图片、视频等 有价值的数据集合 具有特定的意义 可为决策提供依据 具有可破译性、关联性、新 颖性和价值性的加工后信息 例如: -100万( 没有任何 意义) 某公司今 年的利润- 100万(包 含的信息 ,亏损) 该公司今 年亏损, 我不能买 该公司的 股票
全球数据爆发式增长 北京中医荔大等 D%B方牌O罐d 数据:是事实或观察的结果,是对客观事物的逻辑归纳,是用 于表示客观事物的未经加工的原始素材 2008年-2020年全球数据总量 45 160% 40 40 138%140% 35 120% 30 100% 25 80% 20 ◇60% 60% 15 50啊 10 79 40% 5 20% 0.5 0.8 1.2 18 0 0% 2008 2009 2010 2011 2015 2020E ■数据量(ZB) 一◇一增速 2020年中国的数据总量将会超过8000EB,占全球数据总量的比例达21%。将成 世界名列前茅的数据资源大国和全球数据中心
全球数据爆发式增长 数据:是事实或观察的结果,是对客观事物的逻辑归纳,是用 于表示客观事物的未经加工的原始素材 2008年-2020年全球数据总量 2020年中国的数据总量将会超过8000EB,占全球数据总量的比例达21%。将成 世界名列前茅的数据资源大国和全球数据中心
三次信息化浪潮 北京中医荔大等 D%B方牌O罐dd 根据BM前首席执行官郭士纳的观点,T领域每隔十五年就会迎来一 次重大变革 表1-1三次信息化浪潮 信息化浪潮 发生时间 标志 解决问题 代表企业 Intel、AMD、IBM、 第一次浪潮 1980年前后 个人计算机 信息处理 苹果、微软、联想、 戴尔、惠普等 第二次浪潮 1995年前后 互联网 信息传输 雅虎、谷歌、阿里巴 巴、百度、腾讯等 物联网、云 第三次浪潮 2010年前后 计算和大数 信息爆炸 将涌现出一批新的市 场标杆企业 据
三次信息化浪潮 • 根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一 次重大变革 信息化浪潮 发生时间 标志 解决问题 代表企业 第一次浪潮 1980年前后 个人计算机 信息处理 Intel、AMD、IBM、 苹果、微软、联想、 戴尔、惠普等 第二次浪潮 1995年前后 互联网 信息传输 雅虎、谷歌、阿里巴 巴、百度、腾讯等 第三次浪潮 2010年前后 物联网、云 计算和大数 据 信息爆炸 将涌现出一批新的市 场标杆企业 表1-1 三次信息化浪潮
大数据的发展历程 位 北京中医荔大等 2008年《Nature》 2012年3月奥巴马总统 2015年,国务院 专刊“Big Data”, 宣布美国政府启动 发布《促进大数据 分析大数据给数据 “大数据研究和发展 发展行动纲要》。 分析带来的挑战。 计划(BDRDI) 2008年 2011年 2012年 2013年 2015年 2016年 2011年5月,麦肯锡 2012年5月,联合 2016年,国务院 全球研究员发布《大 国发表《大数据促 办公厅发布《关 数据:创新、竞争和 发展:挑战与机遇》 于促进和规范健 生产力的下一个领域》 的政务白皮书。 康医疗大数据应 研究报告。 用发展的指导意 见》
大数据的发展历程 2008年 2011年 2012年 2013年 2008年《Nature》 专刊“Big Data”, 分析大数据给数据 分析带来的挑战。 2011年5月,麦肯锡 全球研究员发布《大 数据:创新、竞争和 生产力的下一个领域》 研究报告。 2012年3月奥巴马总统 宣布美国政府启动 “大数据研究和发展 计划(BDRDI)”。 2012年5月,联合 国发表《大数据促 发展:挑战与机遇》 的政务白皮书。 2015年 2015年,国务院 发布《促进大数据 发展行动纲要》。 2016年,国务院 办公厅发布《关 于促进和规范健 康医疗大数据应 用发展的指导意 见》。 2016年
发达国家大数据相关政策 北京中医荔大亭 美国、欧盟、日本等主要发达经济体采取各种政策举措,积极推进 国家大数据战略,取得了长足进展,成功经验值得中国借鉴。 美 ·2012年3月,白宫发布《大数据研究和发展计划》 ·2013年11月,白宫推出“数据-知识-行动”计划,细化大数据改造国家治理模式等。 ·2014年5月,美国总统办公室提交《大数据:把握机遇,维护价值》政策报告。 国 •2016年5月,白宫发布《联邦大数据研发战略计划》,提出美国下一步大数据发展战 略。 欧 ·2012年9月,欧盟委员会公布“释放欧洲云计算服务潜力”战略。 ·2013年英国政府发布《英国数据能力发展战略规划》,并建立世界首个“开放数据研究所”。 日 ·培育大数据和云计算派生出的新兴产业视为提振经济增长、优化国家治理的重要抓手。 ·2013年6月,日本政府公布《创建最尖端信息技术国家宣言》,开放大数据为核心的IT国家战 本 略,旨在把日本建成具有“世界最高水准的广泛运用信息产业技术的社会
发达国家大数据相关政策 •2012年3月,白宫发布《大数据研究和发展计划》 •2013年11月,白宫推出“数据-知识-行动”计划, 细化大数据改造国家治理模式等。 •2014年5月,美国总统办公室提交《大数据:把握机遇,维护价值》政策报告。 •2016年 5月,白宫发布《联邦大数据研发战略计划》, 提出美国下一步大数据发展战 略。 美 国 • 2012年9月,欧盟委员会公布“释放欧洲云计算服务潜力”战略。 • 2013年英国政府发布《英国数据能力发展战略规划》,并建立世界首个“开放数据研究所”。 欧 盟 •培育大数据和云计算派生出的新兴产业视为提振经济增长、优化国家治理的重要抓手。 • 2013年6月,日本政府公布《创建最尖端信息技术国家宣言》,开放大数据为核心的IT国家战 略,旨在把日本建成具有“世界最高水准的广泛运用信息产业技术的社会”。 日 本 美国、欧盟、日本等主要发达经济体采取各种政策举措,积极推进 国家大数据战略,取得了长足进展,成功经验值得中国借鉴
我国大数据的发展情况 北京中医荔大等 D%B方牌O罐d 39,781 76 节7 公双出行与防量车通调国 56 79。60m 萧山接104个红操 杭州 杭州城市大脑 厦门警方利用大数据破案 MEDICAL IBDR/ 北京大数据研究院中医大数据中心 成立仪式 写医疗宋线,人工写能人让生业 浙江嘉兴使用大数据辅助医生看病 北京大数据研究院中医大数据中心
我国大数据的发展情况 杭州城市大脑 厦门警方利用大数据破案 浙江嘉兴使用大数据辅助医生看病 北京大数据研究院中医大数据中心
我国大数据的发展情况 2020年4月20日,国家发改委首次明确新型基础设施的范围。 新基建聚焦于高质量发展,发力点主要可 归纳为“高科技”和“补短板”两方面。 “硬核科技”是新基建项目规划的重要发 5G基建 特高压 力点和核心理念。 我国科技创新仍存在质量不高,在一些关 键技术领域,还存在受制于人的技术短板 和“卡脖子”难题。 城际高速铁路和 新能源汽车 城市轨道交通 充电桩 数据中心是集中存放计算、存储以及网络 设备的场所,被称为海量信息时代的“诺 亚方舟”。数据中心(DC)按照服务对 象可分为三类:互联网数据中心(DC) 、企业级数据中心(EDC)和国家级数据 大数据中心 人工智能 工业互联网 中心(NDC)。 大数据中心是数字经济的支柱
• 2020年4月20日,国家发改委首次明确新型基础设施的范围。 ➢ 新基建聚焦于高质量发展,发力点主要可 归纳为 “高科技”和“补短板”两方面。 ➢ “硬核科技”是新基建项目规划的重要发 力点和核心理念。 ➢ 我国科技创新仍存在质量不高,在一些关 键技术领域,还存在受制于人的技术短板 和“卡脖子”难题。 ➢ 数据中心是集中存放计算、存储以及网络 设备的场所,被称为海量信息时代的“诺 亚方舟”。数据中心(DC)按照服务对 象可分为三类:互联网数据中心(IDC) 、企业级数据中心(EDC)和国家级数据 中心(NDC)。 ➢ 大数据中心是数字经济的支柱