AI 利器(零):认知金字塔 七猫技术 发表于 2025/03/14 @李天鸣:这篇文章围绕“AI利器系列”展开,介绍AI在提升效率方面的应用,从普通人视角阐述AI发展阶段,以金字塔结构呈现。 底座是通用大模型,介绍其从进入大众视野到普及的历程,分析普通人需关注的维度,如阵营、参数量等,对比生成模型和推理模型,还提及提示词相关内容。第二层聚焦AI智能体,解释其概念,以Manus为例探讨亮点与启发,指出开发AI应用要重视模型能力和升级弹性。第三层的AI合唱团,设想多个智能体协同解决复杂问题的场景。第四层模拟世界涉及“世界模型”概念。…
提升自然语言转换为 SQL 查询(NL2SQL)准确度的探索-- LLaMA-Factory 蒸馏 DeepSeek 模型的方法介绍 蒋乾 发表于 2025/03/06 提升自然语言转换为 SQL 查询可能的3个方向有:1. Prompt 工程,以用户角色提供充足的上下文信息;2. 建设知识库,以系统角色提供上下文信息;3. 增强模型的NL2SQL能力 。 在第3个方向上,我们发现:本地部署的 deepseek-r1:32b 的 NL2SQL 的准确度与满血版的在线 deepseek-r1:671b 存在较大差距。这说明模型能力会影响 NL2SQL 准确性。 本文通过蒸馏 DeepSeek 模型,探索:通过提升模型专业能力,能够提高 NL2SQL 的准确度…
StarRocks 在七猫的应用(四)-探索 StarRocks 读取 Paimon 优势及物化视图加速能力 罗锋 发表于 2025/03/04 一、背景随着公司业务的发展,海量小说数据激增,构建高效数据管理与分析平台刻不容缓,OpenLake(开放数据湖,一种致力于打破数据孤岛,实现各类数据自由流通与协同处理的理念)理念及 Paimon 湖格式因此备受关注。然而,传统数据处理手段在应对海量小说数据时,性能瓶颈与低效率问题突出。StarRocks 作为先进的 MPP(大规模并行处理,Massively Parallel Processing)数据库,其物化视图等特性,为解决这一困境提供了创新思路,也为公司自研分析平台提供了技术支持。 二、收益(一)极致查询性能提升基础查询加速:在直接查询 Paimon Append Only(仅追加写) 表格式的大规模小说数据集(如:paimon 中的dwd.paimon_dwd_filted_flattened_log_inc_h表),StarRocks 展现出惊人的速度,总耗时仅 148.92…
探索AI工具幕后,打造你自己的Agent应用 赵一行 发表于 2025/03/04 文本并不纯粹是一篇教学文章,我们会以制作一个智能的命令行工具为目标,在过程中穿插一些涉及到的行业中术语或扩展知识,以及列举相似功能AI软件的幕后实现,所以你也可以把本文当作一篇AI技术科普。看完全文后,你将收获: 1. 市面上所有AI应用的幕后实现原理 2. 自制Agent框架/程序的能力…
Ants源码分析 NJW 发表于 2025/03/03 本文围绕Go语言的Ants协程池展开深入分析。开篇提出关于协程池的一系列问题,如创建、任务分发、空闲协程选择及清理等,并分享了读前想法与实现。接着详细剖析Ants,其模型包含Pool、Workers等组件。协程池创建采用惰性策略,介绍了Pool和Option的属性及创建函数。WorkerQueue有循环队列和栈两种实现,分别阐述其特点。任务提交涉及自旋锁,任务调度有明确流程。空闲协程通过守护协程定时清理。还介绍了容量变更、预热协程等操作。最后对比个人实现与Ants,如创建策略、任务分发方式等方面的差异,有助于读者全面理解Ants协程池及其应用场景。…
StarRocks 在七猫的应用(三)-实时数据写入与查询性能优化 罗嗣挺 发表于 2025/02/20 为何选择 StarRocks 处理实时数据?在选择 StarRocks 前,我们在开发实时任务时基本只依靠 Flink 内部计算来实现各种场景。但是随着业务的发展,数据繁多、场景越发复杂、大家对数据的准确性要求越来越高,这种开发模式暴露出不少痛点,一起来看下我们的优化方案吧。…
华为ArkUI-X跨平台技术探索 蒋学皓 发表于 2025/01/14 本文讨论了华为 ArkUI-X 跨平台技术,包括背景、开发环境搭建、创建跨平台工程、图片浏览功能案例、跨端技术、面临问题及总结等方面内容。…
基于沉浸度模型预估的广告动态展示 曹超 发表于 2025/01/09 本文主要介绍我们在用户侧建模的首次探索和实践。经过实验分析,取得了初步的结果,在核心指标人均阅读时长、DAU上带来了显著的提升,验证了整个方向的可迭代性。…
AIGC业务平台 黄众喜 发表于 2024/12/24 AIGC平台融合前沿的人工智能技术,包括但不限于生文大模型、生图及视频模型,致力于构建一个高效稳定的AIGC工作流程。我们的目标是通过这些技术提升内容生产的效率,同时降低成本,为业务场景提供强有力的支持。…
团建:商业化与作家平台天平之旅 七猫技术 发表于 2024/12/16 在这个秋意渐浓、枫叶如火的季节里,我们团队在2024年11月30日这个阳光明媚的周六迎来了一次特别的团建活动——前往苏州天平山赏枫,并在阳澄湖畔享受美食。这次旅行不仅加深了同事间的了解与情谊,也让我们有机会远离城市的喧嚣,沉浸在大自然的怀抱中。…
Go1.23 糖果 —— iter 迭代器 七猫技术 发表于 2024/11/28 @李天鸣:本文介绍了 Go 1.23 引入的 iter 迭代器,然后通过案例展示了基础的使用以及函数式的方式,最后简述了实现原理与两种迭代模式。从代码的可读性来看,迭代器增加了代码的理解成本。不过从“对象”的角度来分析,迭代器其实有助于代码封装维护,因为它将分散的逻辑内聚到一起,并且提供了统一的消费模式。…
Go性能优化:基于 Pyroscope 的 PGO 最佳实践 吕栋成 发表于 2024/10/25 性能监控与优化是现代软件开发中不可或缺的一环,尤其是在分布式系统和服务端应用中。通过有效的性能监控工具,开发者能够快速定位并解决性能瓶颈,从而提升系统的响应速度和用户体验。继《使用 Pyrscope 结合 Holmes 加速找到服务瓶颈》之后,Pyroscope 在我们的团队中发挥了重要作用。例如,在 ADX 服务中,通过对深拷贝操作的优化,实现了性能提升 10%的目标;在配置中心方面,我们也通过性能监控发现并解决了多个关键瓶颈。 然而,尽管 Pyroscope 和 Holmes 已经在性能监控方面取得了显著成果,但仍存在一些不足之处。首先,目前只有 Holmes 异常上报机制,缺乏正常运行时的数据上报,这使得在排查问题时缺乏对比基准。其次,随着 Go 语言版本 1.21 的发布,Profile-Guided Optimization (PGO) 已经成为标准特性之一,但 Holmes…
七猫自研机器学习平台 汪鑫 发表于 2024/09/26 七猫小说APP内容推荐的精准度,依赖策略算法的持续迭代,预估模型是算法的核心能力。此前,七猫各项推荐业务接入模型需要一定的学习成本,且各项业务模型独立开发,不同业务间的模型能力不能快速协作和复用,无法形成合力,造成一定的人力浪费。针对这些痛点,我们基于开源框架,自主建设了一个机器学习平台,从特征、训练、部署等方面简化模型接入流程,将通用的数据、基建进行统一,提升模块的复用能力,减少重复开发和人力资源浪费。…
全托管 StarRocks 在七猫的应用和实践 蒋乾 发表于 2024/09/14 七猫数仓团队主要的职责是承接七猫各条业务线的离线数据开发、实时数据开发、指标建设、数据治理等工作。现在七猫有多套全托管 StarRocks 集群在生产环境投入了使用,部分 StarRocks 集群从 EMR StarRocks 集群逐步升级成为全托管 StarRocks 集群。据不完全统计,数据治理前离线数据加实时数据,总数据量大约在 20PB 左右。那数仓团队是如何管理这些数据,支持各条业务线的用数需求的呢?…
Java+MotionEvent实现埋点自动化 盛勇 发表于 2024/07/02 本文旨在帮助测试人员“0”代码完成UI自动操作以及埋点自动校验,基于现状,埋点测试以及每次发版需要花费大量时间验证相关埋点,并且随着业务发展,埋点数量只会越来越多,很难做到每次发版将全部埋点回归验证一遍,虽然线上有埋点数据监控系统,但是发现埋点数据异常时已处于外网阶段,因此需要一套机制降低埋点问题逃逸率,同时降低测试负担,提高测试效率。…
基于Jenkins、Apifox和GitLab实现自动化测试 金李根 发表于 2024/04/07 在现代软件开发实践中,快速迭代和高质量交付的需求日益增长。为了满足这些需求,测试团队必须采用高效的工具和方法来确保软件在整个开发周期中的质量和性能。自动化测试作为一种有效的质量保障手段,能够帮助团队在早期发现和修复缺陷,减少手动测试的负担,提高测试的覆盖率和准确性。Jenkins、Apifox和GitLab的组合为自动化测试提供了一个强大、灵活且高效的解决方案。 一、概述 如下图所示,本课题将详细阐述运用GitLab的触发功能(当代码被推送到GitLab以后)触发Jenkins自动构建和部署,接着运行Apifox的自动化脚本,运行完成后发送通知给飞书,由飞书机器人把结果推送给相关人员的整个过程,配置以及实际应用。 使用这一组合进行性能测试有很多优势: 自动化测试流程:Jenkins可以根据代码的提交自动触发测试,使用Apifox执行API测试用例,并将测试结果反馈给开发和测试团队;快速反馈和问题定位:自动化测试可以快速提供反馈,帮助团队及时发现和定位问题,从而减少修复成本;持续集成和部署:Jenkins支持持续集成和持续部署,确保软件质量的同时加快软件交付速度;文档和协作:Apifox生成的API文档可以实时更新,与团队成员共享,提高沟通效率;版本控制:GitLab的版本控制功能确保代码变更的可追溯性,同时支持代码审查,提高代码质量;可扩展性和可维护性:随着项目的增长和变化,自动化测试用例和流程可以方便地进行扩展和维护,适应不断变化的需求。二、Jenkins部署 1、安装插件 在Jenkins中安装GitLab插件,…
读懂前端「性能优化」 白忠胜 发表于 2024/03/11 背景随着互联网的发展,用户对网页加载速度和交互体验的要求越来越高,前端性能优化是提高网页性能的关键,性能优化是前端开发避不开的话题,一个完美的网站必定是能够给用户提供更优的体验。本文将介绍一些常见的前端性能优化技巧,帮助开发者提高网页加载速度,提升用户体验。 一、性能优化的本质 前端性能优化的本质在于提供更快速、更可靠、更高效的用户体验。优化网站性能不仅仅是为了让网站加载更快,更是为了提高用户满意度、降低跳出率、提升转化率,并最终实现业务目标。 二、基于chrome浏览器分析的性能优化指标 2.1 以用户为中心 First Paint 首次绘制(FP)这个指标用于记录页面第一次绘制像素的时间,如显示页面背景色。First contentful paint 首次内容绘制 (FCP)LCP是指页面开始加载到最大文本块内容或图片显示在页面中的时间。如果 FP 及 FCP 两指标在 2 秒内完成的话我们的页面就算体验优秀。Largest contentful paint 最大内容绘制 (LCP)用于记录视窗内最大的元素绘制的时间,该时间会随着页面渲染变化而变化,因为页面中的最大元素在渲染过程中可能会发生改变,…
纵横小说的上云之路 崔明坤 发表于 2023/12/26 纵横小说业务从传统IDC迁移到云上的过程,历经数月,我们技术中心也是经历了一场全面的业务优化和改变的过程。整个上云的过程是复杂且繁琐的,是在所有运维、后端、测试、产品等同学的一点点一轮轮的调研、讨论、测试中一步步完成的,其中的细枝末节都要经过数次的沟通测试,最终才成功完成上云的迁移。…