-
快速而肮脏的文档分析:在 Python 中结合 GOT-OCR 和 LLama
让我们探索一种结合ocr和llm技术分析图像的方法。虽然这不是专家级方案,但它源于实际应用中的类似方法,更像是一个便捷的周末项目,而非生产就绪代码。让我们开始吧! 目标: 构建一个简单的管道,用于处理图像(或PDF),利用OCR提取文本,再用LLM分析文本以获取有价值的元数据。这对于文档自动分类、来信分析或智能文档管理系统非常有用。我们将使用一些流行的开源工具,简化流程。 前提: 本文假设您已熟悉Hugging Face Transformers库。如不熟悉,请参考Huggi...
作者:wufei123 日期:2025.01.26 分类:python 11 -
使用 Elbow 方法进行 K 均值聚类
概述 聚类分析是一种机器学习技术,用于将未标记的数据集划分成若干组(簇)。简单来说,它将相似的数据点分组到一起。具有相似特征的数据点归为一类,而与其他组差异较大的数据点则被划分到不同的组中。 以购物中心为例,我们可以看到商品按照用途分组:T恤衫在一个区域,裤子在另一个区域,蔬菜区则将苹果、香蕉、芒果等水果归类在一起,方便顾客查找。聚类算法的工作原理与此类似。其他聚类应用场景包括按主题对文档进行分组。 本文将介绍使用 Python 实现 K-means 聚类算法。 前提知识...
作者:wufei123 日期:2025.01.26 分类:python 5 -
Python 与 SQLite 中的一对多和多对多关系
在python中使用数据库时,理解表间关系至关重要。本文以wnba为例,探讨一对多和多对多关系在sqlite中的实现方法,并提供python代码示例。 一对多与多对多关系 一对多关系: 一个表的一条记录与另一个表的多条记录关联。例如,一支球队可以有多名运动员,但每名运动员只属于一支球队。 多对多关系: 一个表的多条记录与另一个表的多条记录关联。例如,一名运动员可以与多个品牌签约,一个品牌也可以与多名运动员签约。 在SQLite中,需要使用连接表(桥接表)来实现多...
作者:wufei123 日期:2025.01.26 分类:python 11 -
使用 Amazon Bedrock 构建个性化学习伴侣
我现在正在攻读硕士学位,我一直想找到方法来减少每天的学习时间。瞧!这是我的解决方案:使用 amazon bedrock 创建一个学习伙伴。 我们将利用 amazon bedrock 来利用 gpt-4 或 t5 等基础模型 (fm) 的力量。 这些模型将帮助我们创建一个生成式人工智能,可以回答用户对我的硕士课程中各种主题的查询,例如量子物理、机器学习等。我们将探索如何微调模型、实施高级提示工程,并利用检索增强生成 (rag) 为学生提供准确的答案。 让我们开始吧!...
作者:wufei123 日期:2025.01.26 分类:python 6 -
如何在 Python 中重写装饰器参数
要修改子类中父类方法的装饰器参数,您必须在子类中重写该方法。仅仅在子类中声明同名的类变量并不会影响装饰器参数,除非您显式地重新定义该方法。 示例代码 将以下代码保存为 test.py 文件: def my_decorator_with_args(param1, param2): """带参数的装饰器""" def actual_decorator(func): def wrappe...
作者:wufei123 日期:2025.01.26 分类:python 10 -
如何使用 Tailwind CSS 创建网格和点背景
背景设计对于增强 web 应用程序的视觉吸引力至关重要。最通用且最具视觉吸引力的图案是网格和点。 tailwind css 凭借其强大的实用程序类,使创建这些模式既简单又高效。在本文中,我们将探索如何使用 tailwind css 创建网格和点背景,并提供分步指导和实际示例。 创建网格背景 网格背景是使用线性渐变结合 tailwind css 中的 bg-[size] 属性创建的。以下是实现这一目标的方法: {/* grid background *...
作者:wufei123 日期:2025.01.26 分类:CSS 3 -
PyTorch 中的 CocoCaptions (2)
请我喝杯咖啡☕ *备忘录: 我的帖子解释了cococaptions()使用带有captions_train2014.json、instances_train2014.json和person_keypoints_train2014.json的train2014、带有captions_val2014.json、instances_val2014.json和person_keypoints_val2014.json的val2014以及带有image_info_test201...
作者:wufei123 日期:2025.01.26 分类:python 4 -
Docker 的开发:第 3 集
本篇是 Ruby on Rails 应用 Docker 化系列的最终篇章。我们将学习如何在容器中执行日常任务。 运行 Rake 任务和 Rails 命令 运行 Rake 任务非常简单。镜像构建完成后,可使用 docker-compose 在容器内执行命令。例如,查看应用路由: $ docker-compose run web rails routes 创建数据库、迁移和填充数据: $ docker-compose run web rails db:create db:mi...
作者:wufei123 日期:2025.01.26 分类:python 7 -
Java中switch 是否能用在 String 上?
可以将switch语句直接用于Java中的String,通过巧妙地将String哈希值转化为跳转表或查找表来实现高效处理。然而,需要注意String值数量过多可能会导致性能下降,此时古老的if-else if-else可能反而更有效率。 Java的switch和String:意料之外的优雅 你可能会问,Java的switch语句能直接用在String上吗?答案是:可以,而且比你想象的更优雅。 这可不是什么新鲜事,但很多人依然停留在老旧的if-else if-else链条里...
作者:wufei123 日期:2025.01.26 分类:JAVA 10