PyTorch核心开发者灵魂发问我们怎么

PyTorch社区最近有一种声音:下个版本应该抛弃Python改用Julia语言。

现在就连PyTorch团队内部也会拿这个说法来开玩笑。

对这个问题,核心开发成员中的EdwardYang在论坛上作出过一些回应。

他认为PyTorch的确越来越像Julia了,比如借鉴Julia的多重分派特性开发了PytorchDispatcher。

PyTorch总体的发展方向也和Julia的愿景一致,也就是同时具备拓展性、易用性和执行性能。

一方面PyTorch的底层代码后期用C++重写以获得更好的性能,另一方面functorch、fx等新功能又让用户可以直接使用Python做以前必须借助C++完成的工作。

那为什么不直接改用Julia呢?

害,其实是舍不得Python那无可替代的生态。

当初从原版Torch使用的Lua改用Python就是看中了生态这一点。这么多年过去了其他语言生态连一点可能超过Python的迹象都没有。

简而言之,Julia语言本身的特性和Python的生态他们全都要,向Julia的优点学习也是团队未来的努力方向。

那么,Julia这种语言到底好在哪,让PyTorch开发团队都向它学习?

面向科学计算设计的语言

Julia来自麻省理工CSAIL实验室,设计初衷就是想要一个既有C的速度又有Ruby的动态性、既能像Matlab一样使用数学表达式又有Python的通用性。

Julia要能像Perl一样自然地处理字符串、像R一样适用于统计,像Shell一样作为胶水语言去和其他语言交互。

要有Hadoop的并行计算能力,又不想要那些繁杂的配置。

最后做出来的Julia采用即时编译(JustInTime),速度比需要解释器的Python快得多,又没有失去交互性。

通过多重分派(MultipleDispatch)特性来实现类型稳定又不时脚本语言的简洁灵活。

同一个函数名对不同参数类型的调用分派不同的操作,因为适合处理多种数据类型还被PyTorch给学了去。

具体到机器学习来说,Julia执行各类算法包括矩阵运算的速度都比Python快得多。

Julia生态里也有自己的开源深度学习框架JuliaFlux。

此外Julia还在语法上对线性代数、数据处理这些场景有额外的优化。

比如支持Unicode数学符号,数字乘以变量时候可以省略「*」,以及索引从1而不是0开始更符合人类直觉….

Julia代码可以写成这样:

α=0.5f(u)=α*u;f(2)sin(2π)

以至于有些数学背景的开发者认为,Julia代码写起来就像在黑板上做数学题一样的,很亲切。

相比之下,用Python做矩阵运算感觉就……不是那么好。

Python:

np.dot(array1,array2)

Julia:

array1.*array2

Julia的历史可以追溯到年,由于想实现的功能太多,直到年才对外发布1.0正式版。

不过最近几年Julia已迅速被金融、医药、航天等一些行业接受,使用者包括摩根大通、辉瑞、NASA等。

△TIOBE指数中的Julia流行趋势变化

Julia改变了过去他们只能用C等高性能语言做底层开发、同时用高易用性的Python等语言做扩展开发的割裂问题。

今年7月,Julia创始团队成立的公司JuliaComputing还获得万美元的A轮融资。

Julia语言速度快、天生适合机器学习又在高速成长,也难怪PyTorch社区会有用Julia替代Python的声音出现。

有人认为Python是一种糟糕的语言,虽然有优秀的生态,但生态中对机器学习最有价值的部分(Numpy)其实是用C实现的。

Python生态虽然强大,但人们对其中的混乱也有不少诟病,各种重复开发的包管理系统让配置好Python开发环境都不是一件容易事。

相比之下,Julia的包管理方案就很统一,虽然有可能是还在起步阶段没来得及混乱。

也有人认为Python这些所谓的缺点其实正是它流行的原因。

像Python、Javascript和PHP这种看起来糟糕的语言,正是因为能够轻松的编写糟糕代码,降低了门槛而流行。

这位要提醒大家Julia自身就带有和其他语言的交互功能,他平常会在Julia代码里调用Huggingface的Python模型作开发,两种生态都用上才是坠吼的。

最后,有人很不理解PyTorch开发团队不选择迁移到Julia的做法,既然Julia语言有所有他们需要的特性,还要花时间在Python里重新造轮子是自找麻烦。

另一位的视角有些微妙的不同:

这正是PyTorch团队想把方便留给用户,而把麻烦留给自己。对这种态度我很感激。




转载请注明:http://www.aierlanlan.com/tzrz/4502.html