分享

AI+信创双轮驱动,新一代高校云数据中心这样建

本帖最后由 Jay 于 2024-4-11 09:22 编辑

今年,政府工作报告强调要“大力发展数字教育”。


今年,政府工作报告强调要“大力发展数字教育”。数字,作为被提及20多次的热词,价值再一次被放大。打造“数字教育新质生产力”,想做和可做的事情有很多。高校得先考虑好这件[紧急要务]:新一代云数据中心怎么建?

这一次,深信服特别联合《中国教育信息化》杂志社邀请教育行业信息化专家共议AI+信创大背景下新一代高校云数据中心建设新思路。

image.png

云数据中心建设问题和挑战

李千目(主持人):高校数字化转型希望达到的目标是通过数字化转型实现治理的现代化和治理能力的现代化,所以对信息中心和数据中心提出新的要求,我们面临哪些新的挑战?

崔建:很多学校都存在多校区,甚至是多地的多校区。这种情况下如何保证业务的平稳、有效,如何满足未来业务的拓展?数据的可靠性,安全,网络以及容灾备份都是需要考虑的侧重点。

夏正伟:这几年业务应用逐渐增多,大模型的崛起使得我们对AI计算资源需求有一个爆炸式的增长;同时我们对业务连续性的要求也越来越高。所以很多学校都在考虑提高数据中心的可靠性,以及在异地实现容灾备份的能力。

吕淑艳:中国政法大学在海淀有一个校区,在昌平有一个校区,我们在做两个校区的互联时发现,原有的4芯光缆已使用20多年,我们的链路资源又匮乏了。有条件有交集的高校是不是可以在链路上实现互联互通互备的机制?

周辉林:南昌大学数据中心经过10多年的发展存在一些问题。原来是分几期建设,前期没有统筹考虑,7个集群里面有多个平台,平台不统一导致管理和运行的不便。南昌大学是江西省教育厅教育专网的主要出口单位,希望后续做一些不同高校间的备份,安全态势感知等工作,更充分地发挥专网的效率。

张涛:高校在智慧校园阶段,服务方式、服务内容发生了较大变化,不仅需要考虑不同时间、不同种类硬件设备的统一管理、集中使用,还需要支撑二级学院、二级单位的教学、科研,这些业务形态也从虚拟化向容器化转变。因此,搭建一个敏捷升级、统一管理的云平台至关重要。越来越多的高校都在建设多校区,多个数据中心之间的容灾备份和统一运维,对数据中心建设提出了一些新的挑战。

云数据中心建设对策

李千目(主持人):数据中心在新的时代不仅仅是传统的资源提供方,更多的是在这个挑战过程中的使能方,让我们在数字化转型过程中能够更有效、更稳定、更安全地,提供基础的技术咨询和相应的支持。针对现在面临的比较紧迫的问题,我们有哪些好的对策和建议?

崔建:北京大学数据中心建成后,为了考虑容灾备份,我们在昌平机房建设了容灾备份系统。但实际运行中,有些操作可能是人为性的,系统可以避免或者保证业务的连续性,但误操作问题仅靠双活无法解决。同时,我们考虑在新业务开展时,部分引入信创相关产品,融入实际的工作和业务发展。

夏正伟:武汉大学长期打造了一个数据中心平台——珞珈云,全部的设备都是自己投资、自己管理、自己维护。在不同年代购置的设备,仍有非常好的兼容性,对于不同厂商的设备也可以做到非常好的纳管,这与深信服的产品迭代是密不可分的。

李千目(主持人):武汉大学当时怎么想到要转换到纯私有云场景下呢?

夏正伟:武汉大学没有大规模使用VMware,而是采用了Openstack架构搭建了第一代私有云。2017年我们又引入了超融合新架构,目前承载的虚拟机达到1000多台。有一些比较特别的业务,例如武大的樱花,预约场景涉及几十万的并发,在高并发的场景下,我们也使用了部分公有云资源。

周辉林:南昌大学在数据中心建设后,也部署了15台超融合服务器。后来发现新校区的空间不够,又反过来想如何重复利用老校区的资源。我们有3个校区5个校园,所以把青山湖老校区的机房重新启用,作为重要系统的灾备。

张涛:高校需要什么样的云数据中心?

第一是融合,对新老业务架构、形态的融合。比如如何在规划新平台时,将老设备、老平台同步利用起来,最大程度提升资源的利用率。

第二是平台要能持续地升级,适配高校越来越多的新业务和新架构。比如高并发的在线赏樱,信创架构下的Arm芯片。要能适配学校业务架构的变化,最为典型的就是刚才讲到的多校区建设。数据中心在初期建设时,就需要考虑跨校区的容灾建设,新校区建成后能快速完成平台升级,无需重复建设。同时要考虑构筑自动化的运维和运营中心,对不同校区的信息化建设进行统一管理的基础上,通过AI辅助运维的方式快速定位故障问题,自动化解决大部分IT故障。

第三是安全,我们在业内首创提出内建安全这样一个理念。

李千目(主持人):以前是系统提供一种功能,我们为了实现这个功能加一系列的安全设备、安全的一些能力,现在是系统本身就带着安全性。

张涛:对。深信服面向 AI运维,包括一些硬件的提前预测、提前更换,可以对业务系统进行拨测,根据服务响应的时延提前进行一些干预。

李千目(主持人):总结各位专家刚才提出来的各种见解和建议,高校需要什么样的数据中心?性能要稳定,能够跨平台跨资源,能够支撑我们多种业务的发展趋势,包括信创、人工智能相关技术的发展。

关于高校信创

李千目(主持人):关于高校的信创大家是怎么看?

夏正伟:武汉大学地理信息专业一直是我们的强势学科,我们全程参与了北斗卫星的一些研发,其实北斗卫星就是国家信息领域的一个重大创新。所以推进信创首先要和人才培养、科学研究结合起来。

其次,推进信创要确立一个从易到难的策略,以一个相对比较平衡的投资和产出比,来获得师生的认可。

同时,围绕高校的实际业务承载,如果到信创环境下,稳定性能不能得到一个基本的延续?我们不能解决了现有的问题,而产生一个新的问题,要循序渐进。

崔建:学校学生实际上也有信创产品使用的需求。怎么无缝地在现有环境下了解信创产品,熟练地使用,也是有明确的需求。

吕淑艳:现在信创产品的稳定性和可靠性是怎么一个程度?是我比较担心的。无论是投资方面还是技术应用层面,包括管理层面,我们需要形成一个机制把信创产品做得更合理可靠,把易用性方面做起来。

周辉林:我们信息化办与信创领域厂商的合作是很紧密的,厂商资源、产业资源可以推进学生信创产品的使用,作为信创领域产教融合的载体或者结合点。

张涛:深信服在信创领域的价值主张是双栈一致。我们已经和大量的信创操作系统,硬件厂商合作,深入到他们代码级的一些开发,甚至是做联合开发。深信服也在和高校计算机相关学院合作,共同进行人才培养。比如安全领域,学校有大量的学生团队可以参与到攻防演练,既提升了自身实战能力,也助力了学校的安全保障。

人工智能在高校的应用

李千目(主持人):在高校信息化建设和数字化转型过程中,我们对人工智能应以拥抱的态度还是审慎的态度?

夏正伟:武汉大学也有教授团队推出了自己的大模型,目前我们总的算力达到7p,可以为校内各个学科的 AI计算提供非常好的支撑。

围绕大模型,我们主要有三个方面的思考。首先是算力,尤其要关注电力消耗的集中化,散热设施要跟上。其次是让算法更优化,以提升资源的使用率。最后是数据。我们这几年先后向太空发射了好几颗卫星,这些卫星就是非常好的数据采集平台,形成我们开放的数据集,这些数据集在共享研究中发挥了非常好的作用。所以围绕算力、算法、算据,我们的人才培养和科技研究进一步得到了深度融合。

吕淑艳:我是持开放拥抱的态度。我们应该走进高校做调查研究,在此基础上用算力和精准的算法算出一套大模型来。高校很多部门在为师生服务耗费了大量的人力物力,这方面能不能解脱出来?另外针对信息中心的管理层面,能不能为我们做一些人工智能运维工作的解脱?

周辉林:我们能否依托政府建设的超算资源,剪裁出适合于我们学校版本的类似GPT的工具,来推动我们的治理,形成一个同类型高校的大模型?

张涛:深信服认为,在使用和构建AI大模型中面临三个问题:研发门槛高、使用成本高、安全风险高。如何解决这些问题呢?

首先我们采用向导式配置,只需在Web界面点击下一步,就可以快速构建自己的模型。第二,通过一半的卡进行性能优化后,可以提升到5倍的性能。第三是创新性地支持模型的动态加密,避免用户知识产权被盗,有效保护用户隐私安全。

我们从2016年开始布局人工智能,正式国内首发安全GPT大模型,整合研发经验以及工程经验,做成面向AI的下一代数据中心产品提供给用户。就像刚才夏主任讲到的,比如他们最多申请的资源,卡是80张,训练的时间周期要1-2个月,我们这套产品可以把整个的训练量、训练时间缩短到一周之内,大大降低了模型训练成本。

李千目(主持人):在人工智能方面,南京理工大学已经开始通过智能系统自动地去查找一些在线课程和精品课程,帮助学生进行辅助式和自主式驱动学习。同时,在信息化建设管理过程中,针对运维预测、故障诊断,提供了一些尝试。希望大家共同把这个领域的相关场景做深做实。

李千目(主持人):非常感谢各位专家,我们在一起围绕数据中心建设,信创建设和人工智能的建设,提出了一些建议和见解。在这里,我也祝愿我们大家在各自岗位上共同努力,做出无愧于这个时代的壮丽篇章。



免责声明:本文系网络转载,版权归原作者所有。但因转载众多,或无法确认真正原始作者,故仅标明转载来源,如涉及作品版权问题,请与我们联系,我们将在第一时间协商版权问题或删除内容!

版权说明:论坛帖子主题均由合作第三方提供并上传,若内容存在侵权,请进行举报

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

联系在线客服