找到“CUDA”相关信息739条结果
  • CUDA开发:检验执行时间
    最终从我的机子里测试出来是运行了309.483ms。当我们把36行到80换成CPU的计算时只需要了0.004736ms。从而可以看出2046*2046的数据量计算,GPU只是处理单纯的的数组加法,并不能发挥优势。GPU的优势到底在哪里,我们得慢慢找,怎么样的计算,才能让GPU发挥比CPU好。
    技术 2011-08-11
  • 为什么要用CUDA 实用转码解决方案解析
    psp虽然没落,但移动设备方面苹果的产品现在无人能敌。但不管是iPhone、iPad,对视频格式的支持也和之前的移动设备一样,限定特定格式。如果去iTunes下载,费时间还费钱,远不如自己转码方便。但现在有什么好的解决方案?我们来分析一下。
    加速大家谈 2011-08-11
  • CUDA:使用更少线程运行更快
    前两部分是有关ILP隐藏计算和访存延迟,从而在GPU低占用率的情况下达到高并行度和吞吐率。下一部分是讨论在共享内存(shared memory)和寄存器(register)之间的权衡,作者从吞吐率的角度上说明使用共享内存达不到最好性能,最好降低占用率从而尽可能多的使用寄存器。
    技术 2011-07-28
  • CUDA:使用更少线程隐藏计算延迟
    这两天看到Vasily Volkov的ppt,对如何更有效的使用GPU做通用计算提出了增加线程级并行以外的另一种方法---增加指令级并行,受益匪浅。刚好也没找到中文版本,就翻译过来与大家交流下,有错误请指正,所有的实验结果和图片均出自原ppt。请参考《Better Performance at Lower Occupancy》后面两个案例。
    技术 2011-07-26
  • NVIDIA丹佛处理器:八核配256个CUDA单元
    Nvidia采用ARM架构的融合处理器计划Project Denver(丹佛工程)实际上已经宣布多时了,但是对于丹佛处理器的详细规格目前还没有获悉,Nvidia方面也是直到今日才给出了丹佛处理器的一些比较具体的信息。
    资讯 2011-07-22
  • CUDA处理非连续内存段的方法
    开发GPUMeanShift的过程中,遇到的复杂问题,这就是CPU与GPU之间的非连续内存拷贝,以下是解决方法。按照以前的思路,对于一段连续CPU内存。
    技术 2011-07-19
  • 使用CUDA和C++ 应对全球变暖危机
    几个星期前,微软发布C++ AMP,将C++扩展到GPU计算领域。作为一名C++爱好者和NVIDIA的GPU架构师,我非常高兴听到这一消息。Visual C++是我最喜欢的编程工具之一,它的更新可以与我帮助设计的并行处理器共同工作。我觉得这的确证明了我们这些年在GPU领域付出的辛勤工作没有白费。
    评论 2011-07-04
  • CUDA开发:真正入手利用GPU计算加法
    本文讲述怎么利用GPU来计算。GPU的计算不像CPU执行,只能一个个运行,而是能对大量的数据并行执行。数量级越大,越能看出并行的魅力。
    技术 2011-07-01
  • NV豪言ARM将统治PC CUDA技术将不会开放
    曾经担任首席科学家的NVIDIA公司院士David Kirk近日在接受媒体采访时称,基于ARM处理器架构、融合GPU图形核心的SoC芯片终将统治整个PC。
    资讯 2011-06-24
  • K均值算法基于CUDA环境的实现
    聚类分析的目的是将若干特征相似的特征模式划分到一个集合,每个集合的特征模式之间按照某种度量来衡量相似程度,使得同一个集合内的数据对象具有...
    技术 2010-07-28