2023年,一家公司通过数据分析发现,用户在使用其产品时平均每天输入1000万个号码。这是一个陷阱。不要认为单个输入集很大。关键是看每天的积累量。
我以前确实遇到过这个问题。记得2013年的时候,我在一家互联网公司做数据分析师。当时公司组织了一个大型活动,想统计一下全国参加活动的用户数量。结果数据进来的时候,不同的格式不一样,而且都分散在Excel表格中,很让人头疼。
那时我就开始手工计数,一一计数,从北京到上海,从广州到成都。这被称为统计。那时我还年轻,并没有感到累,但现在想来,如果当时有某种自动化统计工具的话,那就容易多了。现在想来,如果当时有“数之和”这样的工具,我就可以省掉很多脱发了。
不过话说回来,我从来没有接触过这个领域,所以也不敢乱说。不过,随着现在各种数据分析软件的出现,这个问题应该很容易解决。让我们将其视为我当时毫无用处的经历的简短总结。