Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

是否只支持英伟达的显卡 #339

Closed
jiangbinbin-code opened this issue Apr 2, 2023 · 15 comments
Closed

是否只支持英伟达的显卡 #339

jiangbinbin-code opened this issue Apr 2, 2023 · 15 comments

Comments

@jiangbinbin-code
Copy link

Is your feature request related to a problem? Please describe.

是否只支持英伟达的显卡,其他显卡不支持

Solutions

是否只支持英伟达的显卡,其他显卡不支持

Additional context

No response

@duzx16
Copy link
Member

duzx16 commented Apr 2, 2023

能够运行PyTorch的都可以

@jiangbinbin-code
Copy link
Author

jiangbinbin-code commented Apr 2, 2023 via email

@Looong01
Copy link

Looong01 commented Apr 3, 2023

有个AMD的显卡,运行一直报Could not find module 'nvcuda.dll ,然后换cpu模式也是报这个错,按照#6 (comment) 这个issue去修改了 也还是不行,请问还有什么思路可以修改吗??   ?è @.***  

------------------ 原始邮件 ------------------ 发件人: "Zhengxiao @.>; 发送时间: 2023年4月2日(星期天) 下午3:46 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [THUDM/ChatGLM-6B] 是否只支持英伟达的显卡 (Issue #339) 能够运行PyTorch的都可以 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

需要装Linux、ROCm、hip。虚拟机和wsl是不行的

@yichengming
Copy link

有个AMD的显卡,运行一直报Could not find module 'nvcuda.dll ,然后换cpu模式也是报这个错,按照#6 (comment) 这个issue去修改了 也还是不行,请问还有什么思路可以修改吗??   ?è @.***  

------------------ 原始邮件 ------------------ 发件人: "Zhengxiao @.>; 发送时间: 2023年4月2日(星期天) 下午3:46 收件人: _@**._>; 抄送: _@.>; @._>; 主题: Re: [THUDM/ChatGLM-6B] 是否只支持英伟达的显卡 (Issue #339) 能够运行PyTorch的都可以 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: _@_.*>

需要装Linux、ROCm、hip。虚拟机和wsl是不行的

感谢。 已经跑起来了

@NaMoCv
Copy link

NaMoCv commented Apr 7, 2023

怎么跑起来的,不量化?
我报这个:RuntimeError: Library cudart is not initialized

@yichengming
Copy link

rocm跑起来了。我的测试代码能调用a卡计算了。但是… 这个起不来。可能是我5700xt显卡兼容性问题,第二天买了个2080ti

@Looong01
Copy link

Looong01 commented Apr 8, 2023

rocm跑起来了。我的测试代码能调用a卡计算了。但是… 这个起不来。可能是我5700xt显卡兼容性问题,第二天买了个2080ti

你得把你的报错信息发一下啊,不然没法帮你

@Looong01
Copy link

Looong01 commented Apr 8, 2023

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

是不是物理机的Linux?

如果是,是否按照pytorch官网按照rocm版本的?(ROCm版本的pytorch无法按照conda方式安装

image

@NaMoCv
Copy link

NaMoCv commented Apr 8, 2023

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

是不是物理机的Linux?

如果是,是否按照pytorch官网按照rocm版本的?(ROCm版本的pytorch无法按照conda方式安装

image

物理机linux,rocm;我看过代码了,量化依赖cudart的,没有提供hiprt的调用方法,所以量化用amd显卡跑不起来(cpu可以正常跑)。

@Looong01
Copy link

Looong01 commented Apr 8, 2023

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

是不是物理机的Linux?
如果是,是否按照pytorch官网按照rocm版本的?(ROCm版本的pytorch无法按照conda方式安装
image

物理机linux,rocm;我看过代码了,量化依赖cudart的,没有提供hiprt的调用方法,所以量化用amd显卡跑不起来(cpu可以正常跑)。

你可以考虑用cpu导出量化模型,然后不用运行时量化,直接加载量化后的checkpoint到a卡

@OneiroXL
Copy link

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

我也是报这个错误

@OneiroXL
Copy link

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

是不是物理机的Linux?
如果是,是否按照pytorch官网按照rocm版本的?(ROCm版本的pytorch无法按照conda方式安装
image

物理机linux,rocm;我看过代码了,量化依赖cudart的,没有提供hiprt的调用方法,所以量化用amd显卡跑不起来(cpu可以正常跑)。

你可以考虑用cpu导出量化模型,然后不用运行时量化,直接加载量化后的checkpoint到a卡

直接选择作者提供的量化好的模型是不是也可以

@Looong01
Copy link

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

是不是物理机的Linux?
如果是,是否按照pytorch官网按照rocm版本的?(ROCm版本的pytorch无法按照conda方式安装
image

物理机linux,rocm;我看过代码了,量化依赖cudart的,没有提供hiprt的调用方法,所以量化用amd显卡跑不起来(cpu可以正常跑)。

你可以考虑用cpu导出量化模型,然后不用运行时量化,直接加载量化后的checkpoint到a卡

直接选择作者提供的量化好的模型是不是也可以

是这个道理,但是作者只提供了int4和int4q的量化)

@guoqingkong
Copy link

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

是不是物理机的Linux?
如果是,是否按照pytorch官网按照rocm版本的?(ROCm版本的pytorch无法按照conda方式安装
image

物理机linux,rocm;我看过代码了,量化依赖cudart的,没有提供hiprt的调用方法,所以量化用amd显卡跑不起来(cpu可以正常跑)。

你可以考虑用cpu导出量化模型,然后不用运行时量化,直接加载量化后的checkpoint到a卡

直接选择作者提供的量化好的模型是不是也可以

是这个道理,但是作者只提供了int4和int4q的量化)

直接load int4的模型还是出现cudart 缺失的错误,不晓得怎么绕过去。

@NaMoCv
Copy link

NaMoCv commented May 4, 2023

怎么跑起来的,不量化? 我报这个:RuntimeError: Library cudart is not initialized

是不是物理机的Linux?
如果是,是否按照pytorch官网按照rocm版本的?(ROCm版本的pytorch无法按照conda方式安装
image

物理机linux,rocm;我看过代码了,量化依赖cudart的,没有提供hiprt的调用方法,所以量化用amd显卡跑不起来(cpu可以正常跑)。

你可以考虑用cpu导出量化模型,然后不用运行时量化,直接加载量化后的checkpoint到a卡

直接选择作者提供的量化好的模型是不是也可以

是这个道理,但是作者只提供了int4和int4q的量化)

直接load int4的模型还是出现cudart 缺失的错误,不晓得怎么绕过去。

https://github.com/agrocylo/bitsandbytes-rocm 这好像是指出rocm的量化包,b站上有视频用这跑了,我还没试。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

8 participants