# clickhouse Yandex 于 2016 年开源的列式存储数据库(DBMS),使用 C++ 语言编写,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告 列式储存的好处: ➢ 对于列的聚合,计数,求和等统计操作原因优于行式存储。 ➢由于某一列的数据类型都是相同的,针对于数据存储更容易进行数据压缩,每一列选择更优的数据压缩算法,大大提高了数据的压缩比重。 ➢ 由于数据压缩比更好,一方面节省了磁盘空间,另一方面对于 cache 也有了更大的发挥空间。 DBMS 的功能 几乎覆盖了标准 SQL 的大部分语法,包括 DDL 和...

# GPU 入门概论 摘要:本篇文章旨在为后续 LLM 文章做铺垫,通过本篇文章,我们可以理解: 1、GPU 核心架构及参数 2、2024 主流 GPU 规格及对比 3、NVIDIA 搞的一些奇妙技术 4、云厂商售卖的 GPU 都有啥 5、hands-on lab 自己安装驱动,实现跑开源模型! PS: 本文中如果没有特值,GPU 均指 NVIDIA 的 GPU,本文不讨论华为昇腾 GPU 或 AMD 的 GPU # 前置芝士 # PCIe 交换芯片 CPU、内存、存储(NVME)、GPU、网卡等支持 PCIe 的设备,都可以连接到 PCIe 总线或专门的 PCIe...

# openstack # nova 主机发放完之后可以把镜像删掉,因为系统盘是通过镜像复制的 openstack 中实例快照是作为镜像使用的,可以直接作为云主机镜像,不能直接还原 硬盘快照是用于创建相同的云硬盘,可以挂载给主机,不能直接还原快照。也可以放做启动盘使用 # glance 所有服务的 API endpoint 地址均存放在 keystone 数据库中 写操作会通过 glance-registry,读操作可以直接去数据库中查 glance 使用 swift 123456789101112131415default_store = swiftstores =...

# hive Hive 是由 Facebook 开源,基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类 SQL 查询功能。 Hive 是一个 Hadoop 客户端,用于将 HQL (HiveSQL) 转化成 MapfReduce 程序。 (1) Hive 中每张表的数据存储在 HDFS (2) Hive 分析数据底层的实现是 MapReduce (也可配置为 Sparl 或者 Tez) (3) 执行程序运行在 Yarn 上 # 最小化安装 123456789101112wget...

# spark 分布式计算引擎框架,基于 mapreduce 开发 单机:单进程,单节点 伪分布式:多进程,单节点 分布式:多进程,多节点 分布式计算核心:切分数据,减少数据规模 spark 分布式集群采用集群中心化 框架:不完整的计算机程序 (核心功能已经开发完毕,但是是和业务相关的代码未开发)(MR,spark) 系统:完整的计算机程序 (HDFS,Kafka) 引擎:核心功能 spark 基于 mr 开发,两者区别 1. 开发语言:mr:java,不适合进行大量数据处理。spark:scala,适合大量数据处理,封装大量功能 2. 处理方式:hadoop...

# hadoop Hadoop 是 Apache 软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。 Hadoop 是基于 Java 语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中; Hadoop 的核心是分布式文件系统 HDFS(Hadoop Distributed File System)和 MapReduce; Hadoop 被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力; 解决海量数据存储和分析计算问题 优势: 维护多副本 在集群间分配任务数据,方便扩展 并行工作 自动将失败任务重新分配 #...

# Elastic Stack The Elastic stack, 包括 Elasticsearch、Kibana、Beats 和 Logstash (也称为 ELK Stack)。 Elaticsearch: 简称为 ES, ES 是一个开源的高扩展的分布式全文搜索引擎,是整个 E1astic stack 技术栈的核心。它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别的数据 Kibana: 是一个免费且开放的用户界面,能够让您对 Elasticsearch 数据进行可视化,并让您在 elastic stack...

# 监控 报告系统运行状况 每一部分必须同时监控 内容包括吞吐量 、反应时间、使用率等 提前发现问题 进行服务器性能调整前,知道调整什么 找出系统的瓶颈在什么地方 监控资源类别 公开数据 Web、FTP、SSH、数据库等应用服务 TCP 或 UDP 端口 私有数据 CPU、内存、磁盘、网卡流量等使用信息 用户、进程等运行信息 Cacti 基于 SNMP 协议的监控软件,强大的绘图能力 Nagios 基于 Agent 监控,强大的状态检查与报警机制插件极多,自己写监控脚本潜入到 Nagios 非常方便 Zabbix 基于多种监控机制,支持分布式监控 # zabbix Zabbix...

# 台球 # 握杆 握杆之后来回荡一下,保证前后拉的时候不会拉不开 往后拉杆的时候,手会自然打开。但不要刻意。 往前的时候,会逐渐与掌心之贴合 手架放在距离白球一手的位置。小臂垂直球杆 训练:钟摆荡球杆 # 手架 # 平手架 大拇指关节用力贴食指指关节 收回手调整手架高度 # 凤眼手架 # 库边手架 # 高手架 # 站位 1. 右脚站在握杆手垂直下方处 2. 左脚半弯,站在右脚前,根据身材调整 1. 球杆要放在视线的正下方 1. 向下趴姿势之前先将肩膀侧过来 1. 调整位置的时候是整个中心和球杆一起调整 1. 握好球杆放腰侧 2. 腰和杆形成合适的夹角 3. 杆头顶住白球 4....

# 虚拟化 # kvm 1234567891011121314151617181920# 配置yummount -t iso9660 -o ro,loop xxx /wwwmount 只能mount块设备。mount文件的时候,会先做成块设备,再mount// 把文件做成块设备losetup /dev/loop1 xxx.isolosetup -a// mount -t iso9660 -o ro /dev/loop1 /www -> mount -t iso9660 -o ro,loop xxx /www简写mount xxx.iso /pppmount -l#...