我收集哪些自我数据以及为什么(2020年)

2021-02-06 21:32:01

这是我使用或计划使用的个人数据源的列表,并提供了粗略的指南,以指导您如何使用这些数据。

我的目标是最大程度地自动化数据收集并使其在后台运行,因此人们可以设置一次管道,希望再也不必考虑它了。

这是对我之前关于个人数据令人沮丧状态的帖子的跟进,也是我解决这种令人沮丧状态的部分个人方式。

如果您对冗长的清单感到害怕,则可以直接跳入“数据消费者”。部分以了解如何使用它。

考虑到所有问题,我认为这是一个公平的问题!如果您从不使用这些基础结构,为什么还要打扰这些基础结构并and积数据呢?

在下一节中,我将详细介绍每个特定的数据源,但首先,我将列出它们所有共享的理由:

可能觉得没有必要,但是狗屎会发生。如果您的设备死了,帐户由于某种原因被暂停或公司破产,该怎么办?

大多数数字形式的数据都带有时间戳,因此无需人工即可自动构成您时间线的数据。

我想记住更多,能够回顾我的过去并回顾过去并回忆过去。练习生活记录可以帮助您。

事情会永远被遗忘和丢失是非常错误的。从神经科学的角度来看这是可以理解的,即大脑的能力有限,太分心了,无法一直记住所有事物。也就是说,我想要可以选择是忘记还是记住事件,而且我希望能够潜在地访问被忘记的事件。

大多数收集的数字数据有些定量,可以用来分析您的身体或思想。

正如我提到的那样,大多数收集的数据都用作备份/记录生命/量化自身的一种方式,因此,我不会在“为什么”中再次提及它们。部分。

有些脚本仍然是私有的,因此,如果您想了解更多信息,请告诉我,以便优先考虑共享它们。

我'已经得到了很多与大学的功课和其他早期的项目,它&#39私人善变库的;令人伤心的人在这段擦谁就会失去他们的。

方法:传感器通过蓝牙与手机应用程序同步,/ data / data / com.bluemaestro.tempo_utility / databases /会定期复制以获取数据。 例如。 我可能会看到温度/湿度读数以及远足或滑雪中的照片。 方法:通过Thriva,将数据手动导入到组织模式表中(不经常这样做,因此不值得进行自动抓取) 出于好奇,还跟踪了几天的葡萄糖和酮(具有自由式释放),也没有使它自动化。 方法:在我的计算机和电话上运行的自定义脚本,直接复制底层sqlite数据库。 Emfit QS是一种医疗级睡眠跟踪器。 它比腕带(例如fitbit,颚骨)更昂贵,但也更可靠并且可以提供更多数据。 方法:Endomondo收集GPS数据和HR数据(通过Wahoo Tickr X皮带)。 然后,karlicoss / endoexport。

方法:手动CSV导出,因为我只用了几个星期。 然后同步停止工作,我不得不退回它,但是似乎可以通过API实现。 能够导出已加星标的存储库,因此如果作者删除它们,我仍然会拥有它们 考虑到一切都严重依赖电子邮件,这无疑是您应该导出的最重要的内容 仅手动步骤:启用计划的导出(您可以一次安排每年6次),并选择在导出设置中将其保留在Google云端硬盘上 保留一个脚本来检查已安装的Google云端硬盘是否有新的外卖并将其移到安全的地方 Google会收集大量数据,您可以利用它们。 但是,旧数据已被删除,因此定期导出Takeout很重要。 由于Hackernews没有为此提供API,因此可以通过网络抓取来提取已投票/已保存的项目。 希望有一个现有的库。

我还使用了具有自己的已保存' 发布信息,并且不与Hackernews同步。 导出它们将需要直接从应用程序专用存储中复制数据库。 如何:手动导出带有交易的每月PDF。 他们并没有真正提供API,因此除非您想通过网络抓取并处理2FA,否则似乎是您所能做的最好的事情。 作法:通过API.Jawbone现在已经死了,所以如果您还没有导出它,可能会永远丢失您的数据。 方法:通过karlicoss / kobuddy几乎自动执行。 手动步骤:必须不时通过USB连接阅读器。 我追踪了我在一年中摄入的东西的几乎所有营养数据。 方法:我发现大多数现有的应用程序/项目笨拙且不令人满意,因此我开发了自己的系统,甚至没有一个合适的应用程序,而是一些更简单的方法,基本上是Python的领域特定语言来跟踪它。

#file:food_2017.py = F([[午餐菠菜*袋装,tuna_spring_water *罐头,#此金枪鱼罐头大小为120g beans_broad_wt * can * 0.5,#一半罐头。蚕豆的罐头大小为200g onion_red_tsc * gr(115 ),#克,显式Cheese_salad_tsc * 100,#克,隐含奶酪酸橙,#1水果,隐含],[#晚餐...],tea_black * 10,#杯,隐含wine_red * ml * 150 ,#ml,显式)= ...#更多日志

使用真正的编程语言而非应用程序可以让我变得非常灵活和富有表现力,例如:

例如。如果我在2018年10月10日制作了四份汤,​​立即吃掉一顿并冻结了其他三份,我将定义汤[20180810 = [...]之类的东西,然后我可以在再次吃汤时简单地重复使用汤[20180810。当我将食物放入冰箱时,找出我标记的食物)

我可以将许多内容隐式化,使其表现力强,而无需花费时间进行不必要的输入

我很少需要手动输入营养成分,我只是将产品链接粘贴到了超级市场网站上,并有一个自动脚本来解析营养成分信息

困难的是实际上没有进食,而是在外出就餐时没有营养信息。那一年,我主要自己做饭,因此跟踪非常容易。

另外,我对下限更感兴趣(例如,我是否至少摄入建议量的微量营养素),因此现在不需食用食物对我来说就很好了。

我最想了解食物成分及其与饮食的关系,我做到了

伐木的动力促使我学习不同的食物,并尝试使它们保持平衡的同时尝试各种食物。

我停下来是因为做饭确实要花一些时间,而且我实际上意识到,只要我实际上改变食物并尝试不时地吃所有东西,我就会达到所有推荐量的微量营养素,于是我停了下来。这很明显每个人都建议这样做,但一件事是将其作为常识而听到,而从您的数据得出的结论却完全不同。

方式:如果不时同步/整理照片和视频,则无需额外的精力。

方法:无需执行任何操作,PDF是计算机本地的。您确实需要一些工具来爬网文件系统并提取注释。

我停止使用RTM来支持组织模式,但仍然可以轻松找到我的旧任务和说明,从而实现了平稳过渡。

方法:组织模式,通过组织捕获进入表格。或者,您也可以使用电子表格。

我认为在主观感觉与客观状态(如运动量,睡眠心率等)之间建立联系非常重要,因此我尝试使用仪表板查找相关性

遗憾的是VK破坏了他们的API,因此脚本停止了工作。无论如何,我现在几乎没有使用VK,所以没有足够的动力去解决它。

方式:使用Nomie和Taplog手动进行,但现在仅使用org-mode并使用orgparse提取数据,可能会通过无线秤实现自动化,但对我而言并不重要。

方式:WhatsApp不提供API,因此可能需要从Android应用程序(/data/data/com.whatsapp/databases/msgstore.db)中获取sqlite数据库

方法:从23andme网站手动导出原始数据。希望您的基因组不会经常改变,以免自动导出!

计划针对开源分析工具设置某种对新基因组见解的自动搜索

还没有真正考虑的时间,这感觉像是我的能力范围之外的一个艰巨的项目。

典型的搜索界面让我感到不满意,因为它们孤立,缓慢,难以使用且无法离线工作。因此,我围绕它建立了自己的方式! 我在这里详细介绍它。 本质上,我将大多数在线数据(如聊天记录,评论等)镜像为纯文本,我可以在任何文本编辑器中对其进行概述,并通过一次按键来逐步搜索所有这些数据。 它使您可以受益于围绕组织模式的现有工具和基础架构,其中最著名的是Emacs。 Orger带有一些现有模块,但是如果您需要其他模块,则应该很容易适应您自己的数据源。 promnesia是我正在致力于通过统一注释和浏览来自不同数据源的历史记录来逃避孤岛的浏览器扩展。 我已经使用它一年多了,并进行最后的修饰以将其正确发布给其他人。 作为的忠实拥护者,我致力于根据各种数据源构建的个人健康,睡眠和运动仪表板。

我想查看我的所有数字历史记录,进行搜索,过滤,轻松地在特定时间点跳转并查看发生的上下文,这样就可以将其用作外部存储器。 理想情况下,它看起来类似于安德鲁·路易斯的Memex,或者如果他开源了它甚至可以重用他的界面。 我强烈建议观看他的演讲以获取灵感。 很高兴回答关于我的方法的任何问题,并帮助您解放数据。 在下一篇文章中,我将详细介绍我的数据导出和访问基础结构背后的设计决策。