【熊说星空认证】系统管理员:私有云运维与性能优化原创
金蝶云社区-福分小熊
福分小熊
15人赞赏了该文章 1224次浏览 未经作者许可,禁止转载编辑于2022年02月05日 16:24:37
  • 个人笔记汇总菜单:【熊说星空认证】系统管理员(笔记汇总目录)

  • 本节课涉及到的视频链接:

  • 涉及到论坛上的知识帖:暂无

  • 主讲老师:金蝶云星空技术系统部-彭兴老师(老师社区账号ocreanking_peng

  • 课程简介:介绍金蝶云星空运维最佳实践,帮助学员快速掌握金蝶云星空基础运维核心能力,确保系统持续稳定健康运行。

  • 课程目标:

    • 了解金蝶云星空运维核心知识

    • 提高运维系统能力

  • 课程收益:

    • 降低企业出现性能问题的可能

    • 触使项目快速落地,系统持续稳定运行

    • 提高客户对系统性能表现的满意度

  • 课程互动:

    • 我们经常会遇到下面的问题

      • 硬件配置不错,但性能表现不符合预期

      • 机器还有很多资源没有使用

      • 某些客户端频繁出现502问题

      • 使用过程中,系统突然闪退了

      • 内存很大,但是用很少

      • ……

    • 原因

      • 某个硬件配置太低

      • 选择不合适的操作系统或者数据库系统(比如选了32位操作系统,CPU超过4C性能跟不上)

      • 网络质量不可靠

      • 内存不够

      • 参数设置不合理

      • ……

  • 课程总结:待定

  • 课后思考题:待定


系统运维需要有一个好的基础,项目上线前做好资源估算和预留。

初始化系统基本优化的参数已设置,定义合适的自动优化脚本。

系统使用过程做好持续的优化和监控,有专职有经验的系统管理员。





1.安装环境



1.1部署环境基本要求


硬件要求:

  • X86架构

  • 64位

  • SSD(数据库服务器推荐),SAS(应用服务器可选择):RAID1,5,10?

  • 交换机

  • 中高端存储设备

  • 网线

  • 高主频CPU

  • 机房供电:配置UPS的电源,避免突然断电导致数据库软件突然断电,内存里面的数据未及时写入


软件要求考虑CPU数目支持,内存支持):

  • Windows:64位,Windows 2008 R2企业版后的版本

  • Oracle:64位,11.2.0.4+psu,12.1.0.2+psu Linux内核操作系统(专门针对Oracle定制的Linux操作系统),IC部署高可用

  • SQL Server:拥有CPU核心数目的授权(如果只支持40核、但是电脑为64核的,就有24核性能未用到)

    • 如使用always on等企业特性,需要采用企业版

    • 内存超过128GB,需要采用企业版(标准版只允许在128GB以内,所以超过需要用企业版)

不要选择

  • Solaris:已经不再支持,CPU支持存在问题

  • Aix:性能表现不理想,CPU支持存在问题

  • Windows 2008 R2标段版,内存限制为32GB

  • SQL Server 2008 R2标准版,内存限制为128GB

碰到问题

  • 应用内存无法超过32GB,原因:使用Windows 2008

  • CPU很多,但用不上(使用转换箱规模限制查询),原因:

    • Oracle数据库服务器选择Solaris,Aix操作系统

    • SQL Server没有足够的授权

image.png

image.png

image.png

image.png


基本要求

线下环境数据库强烈建议不要放在虚拟机里面

  • 虚拟环境可能没有最优化

  • 没有构建高可用和做灾备

  • 性能比直接部署物理机差

逻辑错误,无法发现,导致SQL Server备份文件故障以及当前数据文件故障后,无法还原数据库,只能补录数据。

修复SQLSERVER 数据库一致性错误与分配错误_tianlianchao1982的专栏-CSDN博客_sqlserver 一致性错误 原因

image.png

image.png




1.2应用服务器资源查看与监控



image.png

image.png

image.png

image.png



1.3数据库服务器资源查看与监控



image.png

image.png

如果是应用服务器和数据库服务器一同部署的话就要考虑:服务器总共64GB,数据库服务器设置32-40GB。

避免内存争用情况。

image.png

参数做什么用的呢?bak备份文件是经过压缩备份出来的,减少空间占用。

校验和,备份时校验和值,避免压缩不可用。

image.png

image.png

image.png

image.png

image.png

image.png

image.png



1.4网络资源查看与监控



image.png

image.png

耗损越低越高、速度越高越好


image.png

检测请求的耗时情况


【演示】网络命令使用tcping、netstat、ping、tracert、telnet

image.png

image.png

image.png

image.png

image.png

比如应用服务器需要访问数据库应用服务器。


演示:Fiddler

image.png


演示:Wireshark(网络嗅探工具)

比Fiddler工具更全面的抓包工具

使用方法:wireshark抓包分析——TCP/IP协议_网易数帆社区博客-CSDN博客_抓包分析

image.png

案例:网络优化

  • 案例:客户某单据新增中超过6行分录后,通过F7选择资料,携带返回时有停顿现象;查询慢,大概在5秒左右

  • 问题分析:由于在前5行的表现尚可,所以在携带返回时取数的时间不存在问题,检查客户端的网络表现情况。做新增行的测试,用wireshark抓包。可以看到新增行的操作,出现了4次POST,ipv4的Checksum出现了14次校验失败的情况,我们认为是由于网卡设置导致的问题。




2.部署模型

声明

  • 硬件要求管理中心可以支持故障转移,但需要购买管理中心高可用特性(使用haproxy加keepalived部署)

  • 管理中心需要访问外网,以便于进行注册用户许可同步

  • 金蝶云星空使用的会话是有状态的

  • 部署集群需要设置会话保持,客户端使用网络禁止分块传输



2.1简单部署

适用场景:适用小并发场景,对高可用无需求,可允许应用服务器出现宕机。


image.png




2.2分布式部署

适用场景:适合400以下并发场景

对成本计算、MRP计算、出入库核算数据量大时,部署计算服务器


image.png



2.3集群部署

适用场景:

  • 高并发部署,应用服务器集群,通过代理服务器实现(Haproxy或者F5 BIG IP)

  • 数据库负载均衡:

    • Oracle:RAC

    • SQLServer:AlwayOn或者镜像

  • 数据库读写分离:

    • Oracle:RAC

    • SQLServer:事务复制,配置查询库

  • 需要独立交换机(万兆)


image.png


image.png



2.4网络







3.应用服务器运维与优化



3.1应用程序池


队列长度:如果并发数目非常高,客户端出现503提示,可以增加该值

启用32位应用程序=false,不要修改,IIS将以32位方式运行,内存将受限于4GB

image.png


回收

  • 发生配置更改时禁用回收:为何修改某个配置后IIS重启?

  • 固定时间间隔

    • 多长时间后,IIS将会自动回收

    • 为何前端每隔一段时间,出现闪退?

    • 1740大多数情况下并不合适

  • 特定时间

    • 指定某个时间点自动进行回收

    • 选择系统空闲或者维护期间进行

  • 禁用重叠回收

    • 如果为true,将会是在所有工作进程退出后方能进行回收。

    • 如果系统出现问题时,可能某个进程无法正常退出,那应用程序池将无法回收,所以不建议设置为true


image.png


进程孤立:生产环境设置为false,调试时可以设置为true

image.png


闲置超时:

如果应用程序池超过20分钟,将会执行空闲超时选择的操作

设置为0,将不会关闭


空闲超时操作:终止、挂起


最大工作进程数:=1,不要修改,系统不支持多个进程

image.png


快速故障防护:已启用=False

image.png


image.png




3.2站点设置


image.png

image.png

image.png



3.3日志


image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png




3.4优化案例分享


image.png

image.png

image.png

image.png





4.数据库运维与优化



4.0数据库如何选项?选SQL Server还是Oracle?


image.png

到底是选SQL Server还是Oracle?

有Oracle运维背景的建议优先选Oracle。

image.png

image.png

image.png

image.png



4.1SQL Server数据库优化

金蝶云·星空性能专题-SQL Server


image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

SQL Server死锁资源的查看 (kingdee.com)

如何抓取SQL Server死锁信息 (kingdee.com)


image.png

image.png

image.png





4.2优化案例分享


  • 单据列上有是否类型的字段,如单据上有显示0/1类型的空间

  • 减少每页显示的行,控制在200条


image.png


image.png

image.png

image.png

image.png

image.png

image.png

image.png




4.3系统运行监控SQL


image.png

image.png

image.png

image.png


image.png

image.png






5.产品升级



升级预测试、升级前检查、备份数据中心

相关操作可见之前的文章:【熊说星空认证】系统管理员:环境升级与补丁安装 (kingdee.com)

赞 15