Chinese CLIP原理及实践(更新中)

4 篇文章 1 订阅
订阅专栏

在这里插入图片描述

CLIP简介

git地址: Chinese-CLIP
模型下载链接: 模型规模 & 下载链接
作者知乎解读:
中文CLIP模型卷土重来,这次加量不加价!

CLIP使用(及改写)

Inference(需要cn_clip包)

# 计算emb函数
import torch
import numpy as np
from PIL import Image
import torchvision

import cn_clip
import cn_clip.clip as clip
from cn_clip.clip import load_from_name, available_models, load
print("Available models:", available_models())
device = "cuda" if torch.cuda.is_available() else "cpu"
print(device)
# model, preprocess = load_from_name("ViT-B-16", device=device, download_root='./pt_models')
model, preprocess = load_from_name("ViT-H-14", device=device, download_root='../02_CLIP/pt_models')  # 
model.eval()
print('finished')


from PIL import Image
from io import BytesIO
from urllib import request
def url2pil(img_url):
    user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36'
    headers = {'user-agent': user_agent}
    req = request.Request(url=img_url, headers=headers)
    response = request.urlopen(req, timeout=30)
    img= Image.open(BytesIO(response.read())).convert('RGB')
    return img

def get_img_emb(url):
    if not url: return ('1'+'***'+'url')
    try:
        img = url2pil(url)
    except:
        return ('2'+'***'+url)
    image = url2pil(url)
    with torch.no_grad():
        image = preprocess(image).unsqueeze(0).to(device)
        image_features = model.encode_image(image)
        image_features /= image_features.norm(dim=-1, keepdim=True)
        image_features = image_features.cpu().numpy()
        emb = ','.join([str(x) for x in image_features.flatten()])
        return "***".join(('0',url, emb))
        
#get_img_emb(url)


def get_txt_emb_batch(text):
    text = clip.tokenize(text).to(device)
    with torch.no_grad():
        text_features = model.encode_text(text)
    text_features = text_features.detach()
    text_features /= text_features.norm(dim=-1, keepdim=True)
    text_features = text_features.cpu().numpy()
    return text_features

CLIP 数据加载(待更新)

CLIP 训练(待更新)

CLIP Fine

预训练模型选择

考虑到参数量、训练难度及训练时间,根据论文给出的参数量及Finetuning的performance,选择ViT-B/16作为预训练模型:
在这里插入图片描述

=

■ \blacksquare

深度学习Chinese-CLIP 使用教程,图检索,跨模态检索,零样本图片分类
q742971636的博客
10-09 2500
【代码】【深度学习Chinese-CLIP 使用教程,图检索,跨模态检索,零样本图片分类。
多模态表征—CLIPChinese-CLIP:理论讲解、代码微调与论阅读
小小帅
02-26 9733
1.讲解CLIP的主要内容;2.讲解Chinese-CLIP的主要内容;3.CLIP/Chinese-CLIP代码微调;4.CLIP/Chinese-CLIP重点阅读
CLIP快速上手指南
alimuhamad的博客
12-22 4119
当前OpenAI提出的CLIP是AI领域内最火热的多模态预训练模型,简单的图双塔结构让多模态表征学习变得异常简单。此前CLIP只有官方英版本,如果想在领域尤其是业务当使用这种强大的表征模型,需要非常麻烦的翻译工作。近期达摩院提出版本CLIPChinese CLIP系列,在ModelScope和Github均已开源,并且代码也已经并入Huggingface Transformers,在检索任务上效果非常好。这里就根据Chinese CLIP官方介绍来做个简单的快速上手指南。
Chinese-CLIP安装与配置完全指南
最新发布
gitblog_09385的博客
09-13 489
Chinese-CLIP安装与配置完全指南 Chinese-CLIP 针对场景下设计和构建的CLIP模型变体,它能够完成跨视觉与本模态的信息检索,并能够生成有效的多模态表示。这样的工具主要用于提升人工智能系统对于不同模态(如图像和本)数据的理解、关联与检索能力。 ...
超详细微调Chinese Clip以及解决各种报错
weixin_51074012的博客
09-08 1259
微调多模态检索模型Chinese-clip模型
CLIP_inChinese
04-18
多语言CLIP 适用于任何语言的OpenAI CLIP本编码器 ·· 概述 最近发布了一篇论,《 ,其介绍了CLIP(对比语言-图像预训练)模型。 使用对比学习目标,通过匹配本和图像的相应矢量表示,训练该模型以使其连接本和图像。 CLIP由两个单独的模型组成,一个视觉编码器和一个本编码器。 这些内容接受了高达4亿张的图像和相应的字幕的培训。 此后,OpenAI发布了一组较小的CLIP模型,可以在上找到它们。 我们建议进行微调,以使用任何语言的预训练本模型替换原始英语本编码器。 这种方法可以使强大的CLIP模型在大约24个GPU小时内适应任何语言。 该存储库包含 pytorch推断代码 Tensorflow培训代码 预训练的CLIP-Text编码器可支持多种语言 训练数据和预先计算的CLIP本编码,用于 + MSCOCO + VizWiz图像标题的很大一部分 要求
Chinese-CLIP使用教程
m0_63213284的博客
04-27 1772
1.用Make_json.py将xlsx里的本转换成json格式(对于测试集只有本,不知道图对匹配关系的情况,每行的image_ids字段处理为空列表即可,即"image_ids": []);用Img2base64将图片编码成base64格式(.tsv件)2.用build_Imdb_dataset.py把.tsv和.json件转换为内存索引的LMDB数据库件2.5.对模型进行finetune(微调)。(可以不进行,直接用预训练模型)
多模态】4、Chinese CLIP | 专为匹配设计
呆呆的猫的博客
05-20 7452
主要介绍 Chinese CLIP
Chinese-CLIP 使用教程
gitblog_00800的博客
08-08 1215
Chinese-CLIP 使用教程 Chinese-CLIP针对场景下设计和构建的CLIP模型变体,它能够完成跨视觉与本模态的信息检索,并能够生成有效的多模态表示。这样的工具主要用于提升人工智能系统对于不同模态(如图像和本)数据的理解、关联与检索能力。项目地址:https://gitcode.com/gh_mirrors/ch/Chinese-CLIP 项目介绍 Chinese-CL...
多模态预训练模型CLIP版本开放使用
Real_Brilliant的博客
08-01 1725
重在实践
VLM 系列——CLIP——论解读
TigerZ*的博客
01-23 425
CLIP版,训练使用2亿 图- 对的分两阶段训练的对比学习(不是LLM的预测下一个token),是一个双塔模型(图像和本各子拥有一个编码器)。由于对齐了图像和本特征,可以用来做:图-图(没有相关测试任务)、图--图、-没有相关测试任务)的检索,当然 图--图 检索 也可以转化为zero-shot 的分类。
clips手册,学clips必备
03-29
CLIPS手册 学习CLIPS的各种规范 很有用的~~~~~ 看完这个,再看些例程就容易明白了,并可以修改程序了
Python实现图检索系统:Chinese-CLIP课程设计项目
资源摘要信息:"本项目为计算机视觉课程设计的图检索系统,使用Python语言实现基于Chinese-CLIP模型的...通过掌握上述知识点,用户可以更好地理解项目的运作原理,学会如何使用和拓展基于Chinese-CLIP的图检索系统。
clip和blip的区别
人工智能曾小健
06-11 1612
CLIP侧重于学习视觉-语言对齐,适用于图像分类、检索等任务。BLIP在CLIP的基础上,增强了生成能力,能够生成高质量图像描述,应用范围更广。BLIP通过CapFilt模块降低了训练数据噪声,提高了数据质量。新的BLIP-2模型进一步降低了训练成本,通过复用CLIP视觉编码器和大型语言模型实现了强大的视觉-语言理解和生成能力。
卷积神经网络在人工智能人工智能翻译的应用:机器翻译的未来发展趋势
AI天才研究院
07-27 1121
机器翻译(MT)作为一个重要的自然语言处理任务之一,具有广泛的应用场景。目前,机器翻译模型主要包括统计概率模型、非参与型模型、基于神经网络的模型等。本将对卷积神经网络(CNN)在机器翻译的应用进行综述。传统的机器翻译方法通常采用统计或规则方法构建翻译模型。例如,统计方法可以基于计数词频、语言模型等,通过统计概率来计算翻译概率。而非参与型方法,如翻译编辑距离模型、基于感知机的统计机器翻译模型等,则利用强大的特征抽取能力和基于规则的翻译逻辑来构造翻译模型。近年来,基于神经网络的方法也逐渐受到关注。
多任务学习在序列标注任务的应用 Sequence Labeling with MultiTask Learning in TensorFlow
AI天才研究院
08-13 170
自然语言处理(NLP)领域的一个重要任务是序列标注(Sequence Labeling),即将一段本分割成多个词或者词组、句子或者段落,并给每个元素贴上相应的标签或分类。序列标注在许多NLP任务都扮演着至关重要的角色,比如命名实体识别(Named Entity Recognition,NER)、关键词提取(Keyphrase Extraction)、摘要生成(Summarization)等。传统的序列标注方法基于规则的手工设计,它们往往存在一些缺陷,如在一定程度上无法充分利用上下信息;
Chinese-CLIP 项目使用教程
gitblog_00806的博客
08-08 585
Chinese-CLIP 项目使用教程 Chinese-CLIP针对场景下设计和构建的CLIP模型变体,它能够完成跨视觉与本模态的信息检索,并能够生成有效的多模态表示。这样的工具主要用于提升人工智能系统对于不同模态(如图像和本)数据的理解、关联与检索能力。项目地址:https://gitcode.com/gh_mirrors/ch/Chinese-CLIP 1. 项目的目录结构及介绍...
多模态对比学习模型CLIP学习
weixin_42357472的博客
07-13 2551
参考:https://huggingface.co/IDEA-CCNL/Taiyi-CLIP-Roberta-102M-Chinese https://github.com/OFA-Sys/Chinese-CLIP主要用的这个,他还是用的官方openai 的CLIP模型结构,只单独把本塔换成,图片塔还是用训练好的vit模型,训练的时候也把图像模型冻结;所以图像还是用openai 的vit模型,本模型用这里的模型Taiyi-CLIP-Roberta-102M-Chinese***官方案例 ***
CLIP-Chinese:多模态对比学习预训练模型
zenRRan的博客
12-06 4339
每天给你送来NLP技术干货!来自:YeungNLP点击这里进群—>加入NLP交流群笔者最近尝试在业务引入多模态,基于CLIP的思想,实现了基于Vit-Bert的CLIP模型,下面将其称为BertCLIP模型。笔者用140万的数据,基于LiT-tuning的方式,训了一版BertCLIP模型。BertCLIP模型在相似度、本相似度、图片相似度等任务上都有着不错的表现。本...
写文章

热门文章

  • Python numpy.transpose 详解 308717
  • 时域卷积定理及频域卷积定理 38035
  • 图论中的聚类系数(Clustering coefficient)简单介绍 23746
  • 欧拉公式的三种证明方法:导数、幂级数、极坐标 19845
  • [Matplotlib] subplot 理解 19167

分类专栏

  • 专栏01-PySpark使用 8篇
  • 专栏02-大数据与数据分析 4篇
  • 专栏03-图神经网络 13篇
  • 专栏04-数学知识 2篇
  • 专栏05-Machine Leaning 8篇
  • 专栏06-Deep Learning 4篇
  • 专栏07-TensorFlow&Keras 5篇
  • 专栏08-Pytorch 2篇
  • 专栏09-工程开发相关 3篇
  • 专栏10-数学知识 1篇
  • 专栏11-图像处理 8篇
  • 专栏12-可视化 4篇
  • 专栏13-视频处理
  • Numpy 5篇
  • 笔记专栏01-可解释性 2篇
  • 笔记专栏02-推荐和排序
  • 我的笔记
  • 推荐系统 1篇
  • OpenCV 2篇
  • Python 7篇
  • MATLAB 1篇
  • Caffe 1篇

最新评论

  • 欧拉公式的三种证明方法:导数、幂级数、极坐标

    isii: 相关内容详见复变函数教材

  • 欧拉公式的三种证明方法:导数、幂级数、极坐标

    isii: 提醒一下初学的童鞋,复数的导数、幂级数的定义会与实数有区别。这不是简单的代入关系,而是另一套法则下的运算。

  • Hadoop上传和下载大存储的HIVE表

    CSDN-Ada助手: 哇, 你的文章质量真不错,值得学习!不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接;(2)提升标题与正文的相关性;(3)增加除了各种控件外,文章正文的字数。

  • Python numpy.transpose 详解

    weixin_52541085: 清晰明了

  • 欧拉公式的三种证明方法:导数、幂级数、极坐标

    Delta9001: 麦克劳林那里sin和cos反了

大家在看

  • 基于ssm+vue合肥惠康养老平台app(开题报告+源码+论文) 529
  • 许少辉语言午读《乡村振兴战略下传统村落文化旅游设计》正式动作辉少许 1029
  • 【读懂Linux】基础IO 1731
  • C# 标准绘图控件 chart 多 Y 值的编程应用 342
  • MySQL【知识改变命运】09 885

最新文章

  • Pandas实践经验汇总
  • Pytorch DATASETS & DATALOADERS
  • 解决Matplotlib在linux环境下中文乱码问题
2023年10篇
2022年38篇
2021年16篇
2018年1篇
2017年12篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家玻璃钢雕塑摆件骆驼宣威市玻璃钢雕塑设计订制新密肖像玻璃钢仿铜雕塑广东玻璃钢动物雕塑艺术摆件玻璃钢佛像雕塑设计玻璃钢雕塑漆后的维护大连商场玻璃钢雕塑卡通人玻璃钢雕塑摆件多少钱河北人物玻璃钢雕塑东莞透明玻璃钢雕塑生产厂家新乡抽象玻璃钢景观雕塑长沙玻璃钢卡通雕塑订做青海玻璃钢雕塑设计潮汕玻璃钢大猩猩雕塑商场美陈雕塑玻璃钢定制玻璃钢花盆是什么材质卡通人玻璃钢雕塑摆件销售厂家双桥玻璃钢人物雕塑成都玻璃钢雕塑厂联系方式商丘玻璃钢卡通雕塑定做价格玻璃钢景观雕塑免费咨询商丘玻璃钢仿铜雕塑设计北京常用商场美陈多少钱深圳大型商场美陈订购玻璃钢卡通雕塑海豚供应张家口玻璃钢雕塑定制价格玻璃钢雕塑加工价格绍兴玻璃钢陶瓷雕塑介绍上海主题商场美陈价钱廊坊玻璃钢雕塑厂家价格香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化