【SDCC 现场】运维技术与实战专场重点回顾

时间:2024-04-06 18:19:33

【SDCC 现场报道】2016年8月12日-13日,由CSDN重磅打造的互联网应用架构实战峰会、运维技术与实战峰会在成都隆重举行。这两场峰会大牛讲师来自阿里、腾讯、百度、京东、小米、乐视、聚美优品、YY互娱、华为、360等知名互联网公司,共同探讨高可用/高并发/高性能系统架构设计、电商架构、分布式架构、运维工具研发与实践、运维自动化系统的构建、DevOps、云上的运维案例分析、虚拟化技术、应用性能检测与管理、游戏行业的运维实践等内容,以及「构建更安全、更高性能、更稳定的架构和运维体系」等领域的话题与技术。

SDCC 2016架构&运维峰会(成都站)Slides全下载

在13日的运维技术与实战峰会上,来自聚美优品、ThoughtWorks、云霁科技、美团、YY互娱、亚信、多点生活和中国电信等众多专家分享了各自在运维技术领域的众多实践探索。

上午9:00,运维技术与实战峰会在ZStack联合创始人、总架构师张鑫的主持下正式开始。首先,他进行了简单的自我介绍:2010年,受邀赴美加入Cloud.com,成为CloudStack核心开发人员,负责Oracle VM、Barematel、Baremetal VPC等核心功能。于2006年加入Intel开源软件技术中心,从事Xen虚拟机开发。同时,他还介绍了本场峰会的副主持多点用户体验设计师兼程序员鼓励师李苏芸。在简要回顾了昨天的盛会之后,我们迎来了第一位讲师的分享。

【SDCC 2016现场】运维技术与实战专场重点回顾

ZStack联合创始人、总架构师 张鑫

【SDCC 2016现场】运维技术与实战专场重点回顾

多点用户体验设计师兼程序员鼓励师 李苏芸

聚美优品网站运维及开发运维团队总负责人 张川:秒杀场景下的运维架构

聚美优品网站运维及开发运维团队总负责人张川带来了《秒杀场景下的运维架构》的主题分享,主要涉及秒杀场景下面临的问题,和架构的演进秒杀活动下的运维架构两方面内容。在演讲中,他深度剖析了大流量,高并发下的运维架构演进之路,以及大流量,高并发下的运维架构设计。

【SDCC 2016现场】运维技术与实战专场重点回顾

聚美优品网站运维及开发运维团队总负责人 张川

在演讲过程中,他重点介绍了负载均衡系统的核心功能:

【SDCC 2016现场】运维技术与实战专场重点回顾

最后,他列举了常见的几种应用场景:

  • 四层加七层,LVS + NGINX/HAPROXY/VARNISH
  • 单四层,LVS
  • 双四层,LVS + HAPROXY
  • 单七层,HAPROXY/NGINX/VARNISH + HA
  • 双七层,NGINX/HAPROXY + VARNISH

ThoughtWorks高级DevOps技术顾问 林帆:企业级持续交付平台的微服务演进

ThoughtWorks高级DevOps技术顾问林帆的演讲围绕《企业级持续交付平台的微服务演进》主题展开,结合微服务转型的实际项目案例,深度分析微服务架构中的大坑小洼、如何最大化微服务架构的优势两大问题,阐述在对架构进行微服务演进过程中的遇到的问题,并从组织结构、服务拆分、依赖管理等方面讨论实施微服务应用的挑战。希望能对正在和准备采用微服务架构的开发者所有启发。

【SDCC 2016现场】运维技术与实战专场重点回顾

ThoughtWorks高级DevOps技术顾问 林帆

在展示架构演进的过程中,他介绍了团队在八月的架构调整,同时他还强调,架构不是万能的,还需要考虑其在实践中的实施状况。

【SDCC 2016现场】运维技术与实战专场重点回顾

此外,针对分享主题,他总结了其团队在微服务领域的关键实践:

  • 持续交付
  • 全功能团队
  • 自动化运维
  • 服务高可用
  • 不离线部署
  • 监控告警
  • 容器化

金融云DCOS公司云霁科技合伙人 葛梅:超大型互联网IT服务管理和运行指挥体系实践

金融云DCOS公司云霁科技合伙人葛梅带来《超大型互联网IT服务管理和运行指挥体系实践》的主题演讲,主要从面向业务部门的IT服务体系搭建实践、IT服务向IT运营转型的迷惘和突破点两方面展开深入分享, 介绍了IT服务管理定位、IT服务管理历史和趋势、IT服务管理和运营指挥实践经验、一体化运行管理体系展望四部分主要内容。

【SDCC 2016现场】运维技术与实战专场重点回顾

金融云DCOS公司云霁科技合伙人 葛梅

在阐释IT服务管理实践的环节,她还进行了实践经验的总结:

  • 量体裁衣:根据企业规模、阶段,建体系;
  • 始终围绕业务价值/客户价值设立目标;
  • 数字驱动一切;
  • 强大的技术和工具支撑,流程和工具的深度融合。

此外,她还介绍了云霁的操作系统iDCOS:

【SDCC 2016现场】运维技术与实战专场重点回顾

美团高级DBA 翁宁龙:美团数据库运维自动化系统构建之路

美团高级DBA翁宁龙带来《美团数据库运维自动化系统构建之路》主题分享,主要涵盖三部分内容:美团数据库自动化运维系统的架构演变,数据库运维自动化需求的“化解”,和数据库运维自动化系统构架过程中需要注意的坑和值得借鉴的经验,并分析如何快速有效地搭建数据库运维自动化系统。

他特别从构建前、构建中、构建后三个阶段入手,深度剖析,分享美团运维实践过程中的坎坷和思考、经验与教训。

【SDCC 2016现场】运维技术与实战专场重点回顾

美团高级DBA 翁宁龙

他列举出构建前数据库手动运维方面的苦恼,并总结出多、杂、烦三字干概括。

  • 两层或三层数据库架构;
  • 多&重复、没有成长;
  • 杂&经常被打断;
  • 烦&RD经常不按照规范做事。

最后,他重点讲解了构建后的后期规划问题:

【SDCC 2016现场】运维技术与实战专场重点回顾

伴随着新一轮热烈的互动环节,本场峰会上半场结束了。然而,大家的讨论热情却延续到了会议室之外,问答切磋,交流未歇。

【SDCC 2016现场】运维技术与实战专场重点回顾

下午13:30,运维技术与实战专场在主持人张鑫的主持下继续进行,来自YY互娱、亚信、多点生活、中国电信和阿里巴巴等资深专家分享了各自在运维技术领域中的实战经验。

YY互动娱乐事业部运维经理 刘亚丹:扶云直上,基于DevOps理念的PaaS运维平台实践

YY互动娱乐事业部运维经理刘亚丹带来了《扶云直上,基于DevOps理念的PaaS运维平台实践》的主题分享。主要从运维价值体系、运维平台化方式、YY互娱-PaaS平台理念及实践、PaaS平台未来规化四个方面分享实践经验,希望对正在构建PaaS平台化的技术同仁有一些参考意义。

【SDCC 2016现场】运维技术与实战专场重点回顾

YY互动娱乐事业部运维经理 刘亚丹

在正式开始分点详述之前,他先介绍了现阶段YY互娱所采用的PaaS平台整体架构。其中,业务视图包括:多租户、自服务、面向服务;运维视图包括:资源管理、安全管理、监控管理。

【SDCC 2016现场】运维技术与实战专场重点回顾

在介绍YY互娱的PaaS运维平台落地实践经历的环节,他总结出了八大步骤:

  • 标准化:标准自动化落地;
  • XaaS:计算、存储、网络、数据源等;
  • 持续交付:文化,开发、测试、运维流程自动化;
  • 高可用架构:平台架构高可用设计;
  • 弹性扩展:基于资源池化的弹性调度;
  • NoOps:自服务,自助式运维,权限安全,数据安全;
  • 收益与风险:事物必然的两面性;
  • 平台运营:双向反馈,体验优化。

北京亚信智慧数据有限公司大数据云平台CI/CD技术架构师 孟静:使用Drone在OpenShift环境中做持续集成与持续发布

北京亚信智慧数据有限公司大数据云平台CI/CD技术架构师孟静在本次峰会带来的演讲主题是《使用Drone在OpenShift环境中做持续集成与持续发布》,主要基于DataFoundry团队的CI/CD实践经验,与开发者探讨在OpenShift中使用Drone进行持续集成与持续发布,过程中也将涉及到私有镜像仓库的搭建。结合实际案例,更深入披露云平台进行CI/CD实践的所有细节。

【SDCC 2016现场】运维技术与实战专场重点回顾

北京亚信智慧数据有限公司大数据云平台CI/CD技术架构师 孟静

演讲过程中,她具体讲解了LDP云平台的CI/CD架构:

【SDCC 2016现场】运维技术与实战专场重点回顾

此外,她还分析了企业级Registry服务Harbor的特点:

  • 基于角色的访问控制;
  • 图形化用户界面;
  • 审计管理;
  • 国际化;
  • RESTful API
  • 多实例间镜像的复制。

多点生活电商业务部首席架构师 陈泽洪:多点生活在混合云上的架构与运维实践

多点生活电商业务部首席架构师陈泽洪带来主题为《多点生活在混合云上的架构与运维实践》的技术分享,详细分析了四个方面的内容:从架构的角度如何看运维、你的架构是否是可运维的、从私有IDC到公有云该如何构建混合云,以及混合云下的架构和运维有什么不同。

【SDCC 2016现场】运维技术与实战专场重点回顾

多点生活电商业务部首席架构师 陈泽洪

在分享过程中,他抛出了一个问题:“云是新常态,为什么还要混合架构?”随后,他给出了自己的解释,总结混合架构的下列优势:

  • 继续使用已经建设的设施
  • 利用公有云做应用双活、备份、灾难恢复等
  • 实现独特的功能(对象存储)、性能(大促弹性伸缩)
  • 降低单个供应商风险
  • 可以在多个云厂商之间快速切换
  • 敏感数据存储可控

与此同时,它还提供了多点团队自有IDC + 公有云的混合云架构的分析与讲解:

【SDCC 2016现场】运维技术与实战专场重点回顾

中国电信综合平台开发运营中心运维总监&运维架构师 仇国祥:电信亿级互联网产品的运维技术架构实践

中国电信综合平台开发运营中心运维总监&运维架构师仇国祥带来《电信亿级互联网产品的运维技术架构实践》的主题分享。随着移动互联网应用用户群体的爆发性增长,互联网产品的平台集群规模越来越大,系统调用关系越来越复杂,分布式数据库的应用,高可用缓存集群的应用,私有云的应用,多活节点的应用,系统异常检测及修复等都对运维提出了更高的要求。在这样的大环境背景下,他围绕如何从手工维护过度到自动化、平台化,如何更好的高效运维这一问题展开深度讨论。

【SDCC 2016现场】运维技术与实战专场重点回顾

中国电信综合平台开发运营中心运维总监&运维架构师 仇国祥

分享之初,他便强调了规范的重要性,提出“无规范不起航”。在这个话题下,他谈到了运维中持续交付的标准化,并将其分为中间件标准化和流程标准化两部分:

  • 中间件配置标准化

    • 名字服务管理(DNS/HTTP)
    • 系统配置批量变更(内核/limits/磁盘配额等)
    • 常规Nginx配置web化编辑(更新和下发)
    • Java容器配置标准化(工程配置/性能相关参数/数据源)
    • 资源量化分配(Mesos/Marathon)
  • 流程标准化

    • 制订持续集成交付流程(svn->开发->测试->灰度->生产)
    • 配置变更流程(变更->审核(仅灰度/生产环境)->下发)
    • Marathon/监控事件处理流程

在讲解运维专业化的过程中,他列出了达到高效运维的几大必要步骤:

  • 优化监控系统(nagios zabbix cacti业务拨测),监控收敛、日记收集、大数据、性能分析
  • 避免人为故障
  • 容量评估,限流
  • 运维参与架构, 动静态分离 、业务耦合合理分离 、内外部接口分离 集群化、无状态化
  • 流程规范

此外,他还强调备份是必要的,但“没有演练过的备份是无效的”。从容灾备份走向多活这个环节任重而道远,网站、认证方面的服务相对容易实现,而交易类服务,对架构的要求则非常高,有较为复杂。

【SDCC 2016现场】运维技术与实战专场重点回顾

阿里巴巴数据库团队高级专家 周振兴(苏普) 阿里巴巴云时代的数据库管理

本次活动的神秘嘉宾,阿里巴巴数据库团队高级专家周振兴(苏普)在本次峰会中带来了《阿里巴巴云时代的数据库管理》主题演讲,他在演讲中指出随着数据库实例规模的不断扩大,仅通过DBA的手动操作很难完成所有管理与优化,这就需要对性能的极致追求,和大量标准化的实现。围绕这一话题,本次分享将结合阿里巴巴的发展实际和相关案例分析,从业务的发展与规模化、挑战与机遇、DBA的挑战与进化、云时代:让研发具备DBA的能力这四个方面入手,展开具体分析。

【SDCC 2016现场】运维技术与实战专场重点回顾

阿里巴巴数据库团队高级专家 周振兴(苏普)

他提出,面对大规模带来的挑战,需要从以下几个方面加以调整:

  • 对性能的极致追求;
  • 对小概率问题的关注;
  • 业务扩张与多样化。

同时,他还总结了DBA的挑战与进化:

  • 不再处理重复的日常:制定标准与规范
  • 解决深入的、极端的系统问题:形成新的最佳实践;
  • 解决多样化需求与标准化的矛盾:让新技术还曾为新常态。

此外,他指出:“专职的DBA会越来越少:平台会取代DBA的所具备的基础能力;专业的DBA会越来越贵:DBA的专业能力会被平台所放大。”而在阿里云时代,研发将具备DBA的能力,其中就包括诊断与优化。

【SDCC 2016现场】运维技术与实战专场重点回顾

至此,本场运维技术与实战峰会圆满结束,昭示着本次SDCC2016成都站的完美收官,成都站首战告捷。本次峰会的结束并非终结,会场外,借由本次大会搭建的沟通桥梁,学术思维的碰撞仍在继续。与会各方在对本次成都站的顺利举办致以祝贺的同时,均对大会的下一站表示期待。


相关阅读:

【SDCC 2016现场】互联网应用架构实战专场实录