作者:SethStephens-Davidowitz
格式: PDF, TXT, EPUB, MOBI, AZW3, DOCX
网友评价:
- a collection of economics/big data anecdotes. Correlation doesn't imply causation, but "sometimes" correlation helps us detect underwater oddities, reveal truths, or make good enough predictions 缺颗星因为不够严谨
- 后半段还不错
- 期待everybody (still) lies😂 😂😂 Too few of you, big data tells me, are stillbreading.
- 看清这个世界,然后还得爱她,是个历练~
- The next Kinsey will be a data scientist. The next Foucault will be a data scientist. The next Freud will be a data scientist. The next Salk will very well be a data scientist.
- 网络搜索从比较根本上的原因解决了数据统计上garbage in, garbage out的难题,结合着其他的数据确实能看出在一些在其他地方看不出来的问题。当然缺陷也有,数据可以告诉你是什么没办法告诉你为什么,不能告诉你你不知道你不知道的事情,对数据的滥用也是一大问题。ps中国没被作者加入学习案例上简直是一大憾事。pps搜索时学会用隐私频道?
- 拿到了很好的数据,费大功夫清洗。然后就出了些简单的ranking, sentiment analysis的结论?至少,最基本的,图呢?可视化呢? 有点失望。
- Too few of you, big data tells me, are still reading.
- 漫天大雨索性坐在车里把后半本书听完了。听完以后两个最好奇的点,一个是多了两分上清华/北大(或者复旦附中/华二/南外等棒棒高中)和少了两分没上这些学校的人往后的人生数据,另一个是豆瓣想避免被骂可不可以暗搓搓做A/B test……前半段靠轶事吸引public,后半部分开始讲random experiment和data analysis里面的一些基础概念辅以事实。因为跟某曾经做的东西很像,所以整本书听到很多熟悉的东西,虽然social context差别比较大。哎,现在经济学家的一个定义就是会爬数据的statistician啊!很多方向都有创意,我听了超开心的!
- 读它,然后你的书呆子男友会觉得你又聪明又有趣
- Extremely interesting, deserves multiple readings.
- 增加谈资的一本书,前面的章节是基于作者的paper,后面的章节就有点松散了。最喜欢那个选赛马的故事,很有启发。大数据并不在于数据量,而在于寻找新变量。
- 标题党了,核心观点是you are not what you think you are/the self that you advertised,典型例子是Facebook上每个人五光十色的生活和搜索引擎里平庸甚至不堪的日常。
- quote: 书里面的例子还是比较有意思的,虽然观点上并没有太大的创新,值得快速翻一番,加深下印象 https://book.douban.com/review/8744398/
- 还是有趣的,尤其是大段和sex有关的数据。好奇作者团队开会讨论的时候该是怎样的情景。
- 大数据离我们都不远,与其他手段辅助更会有出其不意的效果。书中列举的故事新奇有趣,可读性强。
- Audiobook
- 在Facebook上发表“我的丈夫”这个短句之后最常见的形容词Top 5分别是“the best”、“my best friend”、“awesome”、“amazing”和“so cute”。然而在谷歌搜索引擎上,排在Top 5的就只剩下“awesome”这一个正面词语,其余4个分别是“刻薄mean”、“一个混账a jerk”、“同性恋gay”和“讨人厌annoying”。所以,哪个才是真实的呢?
- 对大数据的使用方向有启发
- 从统计学视角分析「用户搜索」这一当代大数据源。既然没有人会在搜索引擎里面撒谎,那么就可以从这一数据中发现大家平时撒了什么谎。作者列举出来的那些奇奇怪怪的搜索条目真的超有趣(本来作者最开始打算叫这本书为《我的阴茎有多长》来着)。
- 非常适合心理出身的人读 一直到conclusion都非常好读的一本书 Seth的亮点固然不在干货比如如何分析大数据什么的 而是在他可以把一种道理从人性的角度讲透 与此同时 steven pinker的前言我也就读了四五遍而已
- people lies but data won’t.
- 听过……据说全书很有阅读的乐趣~~听起来也很不错。作者通过很多有趣的例子,说明大数据是如何改变人们的“感觉”部分的,比如写错字与潜意识的关系(其实没啥关系)。生活中很多凭感觉做的决定,现在有了可观的数据做参考,发现很多感觉并不是很现实。还讲了大数据的帮助带来准确度和数据库大小没关系,而和抓取和分析数据的方法更相关。还有大数据的应用,既然数据什么都知道,那么人们就没必要闭门造车了,可以充分利用AB法,用数据来判断最终选A还是B更优。奥巴马的竞选网站就是这么做出来的。
- plain English, funny truth serum, mind-blowing jokes
- 科技本身是中性的,产生好或坏的结果取决于使用科技的人
- 初级入门读物。
- 在这本书里,作者基于对谷歌搜索记录的分析,例举了很多很多违反我们直觉的事实,告诉我们世界和我们想的不一样。 比如美国的种族歧视远比你想的严重,比如美国男人女人都会虚报自己性生活次数,比如美国已婚女性比起怀疑自己丈夫是不是出轨,更怀疑自己丈夫是同性恋等等。 除了这些满足读者好奇心的内容之外呢,还介绍了大数据的革新之处以及其局限性。 这书内容本身没有什么难度,算是科普类性质,对于大数据好奇的完全可以拿来看看,非常有意思,而且内容都很新,比如美国大选,还有讲到《127小时》这部电影。
- 这么好的书,版权被买了这么久,中译本居然还没出来......
- 作者说完奇闻小趣事之后..没了,而且还是我都听过的数据整出来的奇闻异事。学过计量的同学就不要看了
- 补mark。。。2020年就在Audible上听完了。。。Google trend软广告
- 读了 abstract 上的书摘
- 蛮有趣的,但是没有什么特别的论点吧
- 感触最深的一段是考没考上第一高中并没有什么差别
- 评价不错,看看能否在年内完成。正想着,有点读Nate Silver的感觉,就把选举扯进去了,哈哈。看着作者后半截拼命凑字数的辛苦,给4个星,其实,只有第4章算作者的成果,其他章节就是抄。不过,很多课题可以从这里展开,算作者一项功德吧。
- 大数据在当代生活的运用。感觉讲得还挺零散的。
- FB最初上线news feed的时候,遭到用户的口诛笔伐:too creepy, too stalker-esque. 但是扎克伯格说其实用户喜欢这个功能,他们表面上说不喜欢,实际上会用得更多。后来的确如此。 ——这本书里充满着大数据会/不会说谎的小故事。 读的过程中一直觉得作者写得很危险,虽然很多真相counterintuitive,但作者给出的其他解释,还是应该更仔细去考量吧?读完回头一看,发现框架不错,他知道自己要写什么,思路清晰。也就是说,其实作者没有把所有细节都罗列出,所以显得不严谨。 读这本书有两种选择:大众心理向或大数据向……作者是利用前者吸引注意力,但其实精华和最有意思的部分在后者。(所以我认真想了想,那本Algorithm to live by也不应当当成心理的猎奇。)
- 很棒!受益匪浅!
- 很好玩啊,好多研究方法确实很聪明,作者在总结里说,根据大数据,没有几个人会读到这里,所以我就不写了,哈哈哈哈
- 问一下各位大神 这本书有译本嘛
- 很多结论还是很有意思的,但是如书中所说,因果关系何在?
- funny and interesting, nothing more than that. Everything stays at surface level
- 数据爆炸的时代,如何简化归集数据,增加数据维度,比数据量更重要
- Another big data book.不见得有多高屋建瓴,但是读过的最有趣的一本,有很多有意思的数据源和分析思路。没有过分鼓吹数据的力量,还花了很多笔墨阐述了大数据的局限性。
- 看了半本,感觉就那样吧,举了一些例子,告诉你一些反直觉的东西,最后从Google的检索数据中挖出一些pattern。
- 魔鬼经济学大数据升级版
- 这本书不但用大数据揭示了很多隐藏的真相,颠覆了一些约定俗成的观念,同时也展示了一种完全不同的做研究的方法。以前读phd的时候就觉得调研数据bias太多,质量远不如behavioral data,但是很多时候behavioral data很难拿到,或者根本找不到。真希望能早几年读到这本书啊!
- 2019年第6本。目前为止大部分社会科学研究都是依赖人们给出的访谈回答或问卷答案,但事实上这可能跟真正的行为大相径庭。那怎么办呢?作者说去看人们在网上搜索的数据。作者是谷歌的data scientist, 用各种搜索数据得出了人们关于婚姻、政治观点、种族观等各方面的估测数据。很有趣。也许是未来几十年社会科学发展的新方向。
- 拾起来之前读了一半的书,还是挺有意思的,之前有类似的idea想做可是一直也没有提上日程。我觉得经济学领域用big data已经很多了,或许其他social science更能benefit from 这些新型的data source。
- 作者的切入点很独特,读起来很有趣味感。印象比较深的是关于看电影的,书中指出暴力电影上映时现实中的暴力程度反而更低,这和人们通常认知中的暴力电影导致暴力行为大相径庭,作者认为这是因为现实中容易出现暴力行为的人都在看暴力电影,没空干别的,所以暴力行为频率就下降了.....emmmm有意思。
- 可以做入门读物,读完确实可以改变对big data浅薄的认识。比如马桶冲水的数据和super bowl总决赛暂停的数据可以联系在一起。有两个问题:1)怎么寻找connection,2)怎么zoom in到实践,这才是big data要做好的。真好,big data提供的是一种新的思考方式,人类的脑袋得更加努力工作啊,反而没有变得轻松起来,这个tense的社会啊
- 除去那些令人瞠目结舌的隐蔽“真相”,本书更多是对社会科学,甚至是任何领域的研究方法提供了很大启发。一位来交流的教授看完这本书确实是联系了作者,已经在合作一个社会心理学的调查了。
- “大数据”版的Freakonomics。基本原理没啥新鲜的,炒大数据这个概念也没啥意思,但是例子都非常有趣。
- Easy to read, more of an advocate for data science, than insights
- 个案的堆砌,没有其他什么内容。
- 好看,超有意思。大数据到底会带给人类什么呢
- 数据和结论的逻辑连接太简单了 但是当做猎奇的书来读就很好玩 比10w+标题党什么的有意思多了(上周在总局开大数据研讨会 真正的决策中大数据绝对不是这么来用的
- Nothing new
- Read it almost in one sitting. My kind of book but a little bit rough on the edges. Not as polished as Nate Silver and lack the theoretical depth of Khaneman. But has the rigor of a skeptical economist
- 终于看完了。。。。对于大数据分析未来会怎样颠覆人文学科的结尾有点意思。其他大概就是各种五花八门的#UselessFacts 另外没想到印度人的pornhub search和google search那么野哈哈哈哈
- 用大数据分析的方法解析人的行为方式,还是很有趣的。平时一个个鸡鸣狗盗之徒打扮的人模狗样,在数据分析面前都被扒光了。
- 文笔有趣,入门科普读物
- 2017 was a much simpler time lol在2020年打开此书的我已经知道了Google和医院的大数据丑闻,也知道big data从collection到conclusion都没有那么神。把很多“成功预测”列在一起确实很容易陷入技术崇拜,但是想一想有多少是马后炮又有多少失误的、成功的案例里又有多少只是碰巧的并不能保证下一次的成功,就觉得还是冷静冷静比较好。不仅仅是道德问题,科学本身也有很多需要进步的地方。作者虽然提了大公司、大政府的问题但是过于浅显,说是right data但是后来自己也放弃了,至少现阶段没有big data你就找不到right data。做个娱乐消遣的书还是推荐的,but do not go gentle into that good night?
- 自己也是做大数据的,可作者写的那么生动有趣,75000字读完后,意犹未尽,连感谢也读完了。书里好多问题真是可以好好去分析看看!
- 惭愧,拖了这么久才看完,但这绝对是2017年看过的最好看的书之一!书中案例详实,而且思路严谨,分析严密,切实做到了MECE;更难能可贵的是,作者的文风和他所讲的故事都不失幽默,看起来一点都不觉得乏味。作者坦承大数据也有局限,并不是万能的,而且大数据可能会带来潜在的道德风险。说到底,数据只是工具,如何看待和利用工具,这些让工具有价值的技能归根结底是人性,只不过大数据让我们之前百般回避的人性的阴暗面变得更加赤裸血淋,我们不得不正视自己内心的“小”。很多角度让我眼界大开,比如dimensionality谬误,大数据的dimensionality超过了我们的想象,导致之前我们赖以生存发展的方法移植过来会水土不服。所以,面对海量的数据,重要是要保持一颗谦卑的心和一枚清醒的大脑。
- 给初中生当科普看吧。作者太自以为是。
- 里面有一句。本来作者想把书名定为how big is my penis (大概)。。结果出版商不愿意
- 科学不一定造福了人类,也有可能只是一个小团体的自娱自乐,并没有实用价值。/ 人能总结的经验,来自于对身边所经历的事的总结,这是小数据,高效,但容易形成偏见。/人在互联网上所传递的观点比问卷调查所呈现的观点,更为可信。
- 有意思,推荐给了很多人
- 作者在conclusion里揭露了自己是个单身狗😂
- 非常喜欢,知道点关于无所不能的big data的皮毛。开始觉着作者腔调怎么那么像Freakonomics,读到后记看到原来有致敬的成份在里面。今年目前最喜欢的非虚构类书籍了。
- 这本书简直颠覆我对大数据的看法,原来数据有那么多有意思并且富有创意的获取方式,并且别具一格的视角能够发现很多隐蔽的事实。真的太有意思了!
- 前面关于怎么用google search来纠正传统survey/pooling的response bias很有新意,google,facebook的数据的确能做一些事,但没有什么一拍脑袋的我这个方向的好点子。后面就有点重复了,初看惊艳,逐渐落于平淡。
- 近期閱讀的最佳書籍。簡明扼要揭示大數據下的時代面貌,讓讀者用更全面、批判的角度去看待身處的世界。暗網是世人不願直望卻已滋長得蓬勃的地下世界,google 則是一大個誠實豆沙包。你不願意向他人承認的心聲或意見,大數據早已記下再整合。
- 还不错 very easy to read, facts that reveal the distasteful truth about human nature
- 主要是讲大数据的利弊,和说谎没啥关系
- A/B测试和相似性
- 算是大数据的入门介绍读物吧,还是个economist写的,从数据的独特性真实性和大样本量讲大数据在现代社会研究的有用之处。很生动,很多东西就是我现在在做的,很开心大众对这样的研究接受度越来越高,也越来越感兴趣。关于性和婚姻的那一部分略为哗众取宠,不过能写成他这样没有门槛也是很难得了。结尾很搞笑:I am going to get a beer with some friends and stop working on this damn conclusion. Too few of you, Big Data tells me, are still reading。
- freakonomics里有一期谈过,用google search的数据讲些比较猎奇的故事。
- “大数据”版的Freakonomics.炒大数据破梗。。。拉低档次。。。可惜了。不过data never lies真相了
- 例子相当有趣,想到Lie to me里的话:Truth or happiness,never both。所以有baidu trends这种东西吗?
- 有很多东西是我们平时看不到的,只能通过数据才能了解。
- 非常喜欢作者思考问题的方式。也很喜欢他对于bigdata的理解和运用。很有启迪。作者的文笔也很轻松,读起来非常有趣。
- 偶然看到关注的微信公众号,在分享这书本里的一些观点和结论,觉得很新鲜,于是找来看。 打三颗星而没有选择推荐的原因是,这本书更多只是在分享,关于作者和他的朋友们在谷歌搜索上收集的数据,对比日常中人们所说的一些事情,形成极大反差。 比如,美国的种族歧视问题,其中关于川普支持者所在地区的分析很有意思,有一定的吻合度。 举了很多例子,主要还是想说人们心里想的,说的,和做的往往是不一致的,而数据会真实地记录这一切。 对于数据和人工智能,我有一些看法,机器终归是执行,思考是属于人类的。就像一堆数据,如果没有人提供指令,机器是不能理解它背后代表什么,需要提取什么内容来完成什么目的。
- 社交媒體讓愛攀比的青春期沒玩沒了,故,永遠不要拿你的搜索內容和別人在社交網絡上發佈的內容做比較……下一個佛洛依德將會是一位數據科學家,下一個馬克思將會是一位數據科學家,下一個索爾克很可能也是一位數據科學家……
- 可能因为自己从业这个领域,没有什么惊奇,倒是觉得我可贡献一些例子出来探讨。作者说到google搜索数据是真相,而facebook数据都是“数字谎言”这个倒是说的很对。
- 很想读,但还没找到。只能一跺脚自己买了
- 大数据时代下的秘密 人性不分国界
- 大数据将为社会科学带来一场革命,就像显微镜和望远镜彻底变革了自然科学那样
- 真的非常颠覆,强推!
- stories from data by an economist
- 从谷歌搜索的大数据分析抛出隐藏的真相,颠覆了传统心理学和社会学研究,大数据的独特性、真实性、样本量大、用于研究因果关系(A/B测试)。
- causal inference again, 从这本书中了解到了更多的porn website 奇怪的知识也增加了
- 看完之后每次想在社交网络说点什么都要灵魂拷问一番,不过适度自我欺骗也不是什么坏事
- I love the ending! That's the Big data specialist's creative idea
- Smart and fun, but too political. Limited insights.
- 书中谈到了社交媒体数据的欺骗性:因为爱面子,人们往往会把生活粉饰的多姿多彩。还提到除了社交媒体,人们在很多场合,对于很多问题都会撒谎,尤其是对敏感问题。当被问到关于仇恨、抑郁、性这些问题的真实想法时,我们得到的往往是谎言。更多:http://dwz.cn/6GTHHN
- 炸,非常炸,数据科学确实是下一个(或者当前)最重要的科学,尤其是和其他学科结合。这书算是新社科了,比之前的实验性社科或者臆测性社科更加有理有据,非常有说服力。
- 最开始觉得解决了很多疑问,越往后看越恐怖,基本没隐私了,还可能被滥用,被操控,细思极恐。
- 还是感觉谈论得太泛泛,属于可以在饭桌上问其他人,你猜失业率上升以后最火的搜索词儿是啥?不是找新工作哟,是pornhub之类对话博一笑耳
- 听董老师课的时候介绍的
- 感觉像一个针对社科研究人员的Google产品广告: “How to publish a lot using data from Google Trends?”
- 大数据用途真的很多,people lies but data won’t.
- 头开得很好,也讲了很多数据分析的故事。就是谈sex 谈的多了点。