精度

2021-8-6 22:16
我刚刚向 Futhark 添加了半精度浮点数,如 f16 类型。这并不是特别困难(也许是一天的工作),但由于相当浅薄的技术原因,这很烦人,所以作为一点宣泄,这里有一篇关于我遇到的挑战的博客文章。首先,为什么我们甚至想要 16 位浮点数?它们的精度非常糟糕,最大的可表示值仅为 65504。显然 16 位浮点数在 80 ......
2020-9-2 15:44
IEEE754规范定义了许多浮点类型,包括:二进制16、二进制32、二进制64和二进制128。大多数开发人员熟悉binary32(相当于C#中的Float)和binary64(相当于C#中的Double)。它们提供了一种标准格式来以许多应用程序可以接受的精度表示大范围的值。.NET一直有Float和Double两种类......