本文系河北省青少年科技创新大赛获奖作品,有删无改(保留完整目录),后附设计稿
建议使用电脑阅读。

摘要: 当今互联网发展迅速,各种各样的互联网产品涌现,很多人通过互联网进行工作、学习、娱乐、社交,网络社交模式却一直没有太大的变化。这在一方面代表着现行的社交模式比较合理、完善,但在另一方面也代表着互联网的新变化没有为社交模式带来实质性的改变。本文探讨了原有网络社交模式的利弊,并随之提出了一个新的网络社交模式,充分发挥互联网新思维,尝试建立一个更加简洁、可塑、高效、舒适的网络社区。
关键词: 网络社区 协同创作 推荐算法 虚拟货币

课题的由来

我们在日常的生活中使用过各种各样的网络社区,它们有的运营多年,有的刚刚开始运营。我们也发现有些网络社区的一些问题饱受诟病,还有些网络社区的一些功能难以使用。
与此同时,各大互联网公司与新兴创业团队都在探索更好的网站运行模式,智能算法也有了广泛的应用。我们认为那些长时间的运营的网络社区在运营中逐渐形成了现有的机制,用户与机制互相适应,运营者对机制进行过多的修改反而可能会导致用户的不适。
我们两人都是计算机爱好者,对计算机的方方面面都有着一股好奇心,喜欢钻研。在信息竞赛培训中相识,在学习信息竞赛的过程中接触到了更多的计算机知识。信息竞赛的考试结束后,这个课题逐渐成型。我们认为,社区机制还有很大的升级空间,在互联网产业高速发展、社会变革的时代,我们应该为网络社交带来一些改变。因此,我们分析了目前主流网络社区的弊端,设计了一个新的网络社区模型,并对这个模型进行了初步的实现。在下文中我们称呼这个模型及按照模型搭建的网络社区为 Theta。

研究背景

国内网络社区现状分析

我们对于网络社区的定义比较宽泛,我们把所有社交性强的,以不同方式汇集用户的,功能不同的各类网站都称为网络社区。
网络社区中有一类社区中的社交活动主要依赖于真实的人际关系(如 QQ 空间),这类社区中用户的行为受到真实生活中复杂条件的影响,很难仅仅通过用户在网络社区中的表现研究其兴趣爱好、使用习惯,在本文中不考虑这类网络社区。 我们对国内各种影响力较大的网络社区进行了研究,现选择三个有代表性的分析如下。

新浪微博(weibo.com)

一个基于用户关系的信息分享、传播以及获取信息的平台,媒体监控和跟踪突发消息的重要来源,实名社交平台。因为认证机制的存在,大量政府部门和社会机构、名人在新浪微博开通账户发布信息,内容真实性高、关注量大。微博的爆裂式共享机制促进了信息的快速传播。
新浪微博将用户置于网络上虚拟的一个社会环境中,每名用户都有权利发声,用户通过关注他人、搜索话题、随机内容等不同的方式查看他人的推送。在微博,用户能遇到各种各样的人,人们在热门话题中的表现能够明显地体现出整个用户群的主流观点,由于微博用户群庞大,这往往也能折射出整个社会的主流观点。
但是,在日常使用中,用户常常需要花费大量的时间阅读推送的内容,其中一些是用户不需要或不必看到的,导致用户的时间、精力被白白浪费。在热点话题出现时常常出现刷屏现象,这时推送内容高度重复,其他的内容被掩盖,影响了用户的正常使用。在微博出现的刷评论的行为虽然能够表达公众的意见,但其内容往往没有太多的实际意义,容易出现人身攻击等不良现象,仍有改进的空间。

百度贴吧(tieba.baidu.com)

百度贴吧的组建依靠关键词,将用户按兴趣爱好聚合在一起,通过一名用户发贴即可发起一场讨论,由吧内自行组建管理体系,吧内管理员与百度共同维护秩序。门槛低,可以快速的发起互动。
百度贴吧包含很多虚拟环境,每个虚拟环境都代表着一个特定的话题,用户可以根据自己的需要加入不同的贴吧并即时参与到贴吧讨论中。对于用户来说,贴吧是一个可以低成本获取高可信度内容、资源的地方。
百度贴吧已经形成了独有的贴吧文化与管理模式,我们可以从其中窥见百度贴吧机制上的漏洞。百度贴吧按照用户每天的签到、发帖情况给予经验值,划分用户等级,由此出现了水楼、凌晨签到等行为,破坏了贴吧的等级制度。百度贴吧中的帖子默认按最后更新时间排列,因此大部分贴吧不允许用户回复更新时间久远的帖子,再加上贴吧对新成员没有审核机制,贴吧中也出现过恶意刷帖妨碍正常使用的现象。

知乎(zhihu.com)

中文互联网高质量内容社区,国内知名社会化网络问答社区,以高质量多样性著称。知乎在建立初期邀请了大量互联网界的知名人士,如愿建立起了良好的基础氛围。知乎在运营的过程中,也通过「赞同、反对、没有帮助」等本身的投票功能,以及外部输出的知乎阅读、知乎日报等方式鼓励用户共享高质量的内容。
由于知乎在运营初期不开放注册,所以知乎进入公众视野的时间并不长。知乎在邀请制时期,大部分用户是高端用户,是各个领域的佼佼者,他们形成了知乎互相尊重、理性分析的独特文化。在知乎开放之后,知乎优质内容被其他平台大量引用,普通用户涌入,冲击了知乎的社区模式,也暴露出知乎社区模式的弊端。
在知乎提交的优质回答很容易被其他网站、公众号引用,但作者得不到相应的回报。后台的数据分析挖掘能力不足使知乎对用户的辨别能力不够,并通过运维人员的大量人工介入来维持秩序。知乎没有对社区机制进行改进,而是尝试把暴露出机制漏洞的用户赶出去,从而一次次失去了优化系统平台的机会。

网站开发技术简介

经典互联网产品分 B/S,C/S 两种结构。随着 Google Chrome V8 引擎、React 引擎的出现,浏览器应用推广,两种结构之间的界限逐渐模糊,但总体上分为运行在客户机上的前端、运行在服务器上的后端。我们对网站开发技术的认识仍然十分局限,但我们找到了两张图(图 1、图 2)能够直观地说明网站开发技术是多种多样的。

前端

目前的浏览器呈现技术 HTML+CSS+JavaScript 是被广泛认可并被大规模使用的,目前被公认的最新版本是 HTML5、CSS3 以及 ECMAScript 6。
目前流行的前端框架有很多,各有特色,所属的功能层不同,其中: Less,Sass 用于 css 样式的预处理,Bootstrap、Foundation、Angular、jQuery-UI、React 等,包含 js、css 库,用于用户界面的构建。

后端

后端通常包括 Web 服务器,数据库和用于生成页面的脚本语言。
流行的数据库 MySQL,Oracle,DB2,SQL Server,Access,Informix,PostgreSQL 等;流行的 Web 服务器主要有 Apache,IIS,Nginx 等;流行的脚本语言有 ASP.NET,PHP,Ruby,Perl,Python 等。
另外,近年 Node.js 逐渐变得热门,Node.js 是一个运行环境,使用 JavaScript 作为脚本语言。

设计理念

基本模型

我们参考了很多大型网络社区的机制,从中提取出一个基本模型,然后对这一社区模型进行修改优化,使其更符合内容有效分类,用户筛选信息成本低,内容质量尽量高,大部分用户都能有效参与这些要求。因为各种网络社区机制都有其独有的特色,所以我们通过提取基本模型的方式选取了各个网络社区中值得借鉴的地方。

协同创作

我们在完善模型的过程中借鉴了「协同创作」的理念,通过对各种情形的分析、对模型进行调整,让机制本身引导用户相互配合,共同创作,又提供不同于传统评论区的评论功能,让用户针对特定的内容进行更加精准的讨论,进一步促进了内容优质化。最终的目标是用户群体自然的产出可供他人阅读的内容。

简洁与可塑性

当前简洁的设计风格逐渐流行,各种新型网站也趋于将功能简化,我们认为这样的潮流是符合大众需求的,但有些网站在设计上过于简洁,只用一些图标表示功能,反而提高了网站的使用门槛,所以我们在进行设计的时候也考虑到了必要的文字提示。
同时由于简洁的设计会让功能有所减少,我们尽量使模型具有较高的可塑性,以此丰富网站功能。例如:在 Theta 中,发起公开讨论、提问、撰写文章的功能被整合为同一个功能,通过自定义设置使该功能表现出不同的特征;系统通过分析向每一个用户呈现个性化的内容,这种个性化不只是简单的类别个性化,而是具体内容的个性化。

减少重复无意义内容

「斗图」「抖机灵」是在社交网站中常见的内容与现象,我们最初不认为这有什么不好。随着我们逐渐接触到了一些小众社区,看到了人们认真讨论的情景,学到了很多新知识。我们发现,前面所说的那些行为,为人们带来了愉悦感,可是不像小众社区的讨论那样对人们的生活带来实质性的帮助。所以我们想尽量减少这种内容的出现。
重复或相似内容的出现往往是有其原因的,有时是用户不知道已经存在该内容,有时是出于恶意。对于重复或相似内容,处理它的最好的方法是聚合这些内容,这样既可以体现出其数量大的特点,又能避免这些重复或相似的内容“刷屏”,影响其他内容的正常展示。

功能介绍及设计过程

功能与机制

开发过程

技术的选择与使用

开发网站的第一步就是拥有一个服务器,我们租赁了 VPS 作为 Theta 的页面及数据服务器,并使用了我们现有的域名进行地址解析。
我们二人都维护着自己的博客,所以我们参考了博客的开发过程,以博客的代码作为基础进行前端开发。
在前端,我们基于 Bootstrap Font-Awesome 进行用户界面的构建,此外还使用了 JQuery.js 简化 js 代码,Anchor.js 生成页面锚链接,SimpleMDE.js 构建网页 MarkDown 实时编辑等等多个 js 库进行开发。
后端采用 PHP7 作为脚本语言,服务端使用 Apache/Nginx,数据库使用 MySQL。PHP 主要适用于 Web 开发领域,语法吸收 C,Java,和 Perl 的特点,易于编写;MySQL 在 WEB 应用方面是 RDBMS(关系数据库管理系统)应用软件。由于其社区版的性能卓越,搭配 PHP 和 Apache/Nginx 可组成良好的开发环境。
在代码管理方面,最初我们使用 FTP 向服务器提交更新,但在一段时间的使用过程中,我们发现,FTP 协议在低网速状态下不是十分稳定,而且 Linux 下的 Atom、Visual Studio Code、Vim 等编辑器在处理 FTP 文件时都存在或多或少的问题,而 Windows 下则无法直接通过 FTP 编辑,所以我们在服务器上搭建了 Git 服务,Git 基于 HTTP/HTTPS/SSH 进行更新,而且其版本控制功能也使我们两人共同编辑文件更加方便。

功能实现

表单提交

同过使用 jQuery.js 我们通过同一块代码控制网站中的大部分表单的提交行为。服务器通过对数据的处理、进行数据库操作,最终返回 JSON 数据,再由 js 做进一步处理。

数据库操作

这里是数据库操作的常用脚本,考虑到模块化的重要性,我们将这些内容封装于不同的文件中,以便随时调用。

文本处理

为了方便用户排版,也为了使页面显示统一,我们在网站中使用 Markdown 处理文本,通过 SimpleMDE.js 实现实时预览与 markdown 转 html 的工作。

评论区

我们在网络上查找类似的实现方式,有的是按段落拆分评论区,有的是固定了文本区域的宽度,但都不符合我们的要求。这一功能要求 js 自动地选择合适的评论进行显示,并且要求自动适应各种尺寸的屏幕,我们想到了一个利用 Bootstrap 的滚动监听功能简单实现的方法,但是由于时间紧张,我们的代码仍然存在各种瑕疵,所以在这里提供大致流程。

实用性分析

热点跟踪

观点分类统计

通过机制筛选的有效性

用户体验

社会价值与创新点

基于新的互联网背景构建网络社区的社会价值

Theta 网络社区模型从现有的网络社区运行状况中汲取经验,将本来用于团队内、技术领域的协同创作模式用于大众社交,从视频弹幕中获取灵感使冗长的评论区变得灵活轻便,将虚拟货币作为必需品来加强用户积极性,使用可以自我学习的分析系统为用户减轻负担,是一个新颖的社区模式。
Theta 的模式中融入了我们新一代的思维,我们认为,当代的科学技术快速发展,知识体系越加复杂,社会分工不断细化,互联网发展迅速,获取知识更加容易、成本很低,有疑问也可以方便的获得解答,但同时,掌握全部知识变得不可能,所以同知识体系内与不同知识体系之间的交流与合作变得尤为重要。
我们解决的并不是原本无法被解决的问题,我们的这次研究是对网络社区发展的一次推动,一次尝试。现在大家都能感受到,我们这些伴随着互联网一起长大的人才是最能适应这个快速发展的时代的人群,原有的网络社区模式需要得到创新性的改进才能适应新的用户群。

本次研究的创新点

  1. 对目前国内的网络社交环境与用户的感受进行分析,发现了现有网络社区存在的缺陷。
  2. 基于现有的社交模式提出了新的社交模式,将协同创作融入社交中,为网络社区的发展方向提供了一个参考。
  3. 在挖掘用户数据上进行了一些尝试,主动进行用户习惯调查,并尽量使收集数据的过程不增加用户的使用成本。
  4. 推广使用功能性虚拟货币,并且通过制定比较复杂的使用规则,使虚拟货币的使用更加灵活,承载更多的社区功能。

总结与展望

研究中的问题与局限

因为我们的研究在高二时就开始,磕磕绊绊,两次暂停,两次重启,进入高三后才逐渐完成,学习压力大,对于模型的打磨还不够,没有完全实现模型中的所有功能。受到经济条件、时间条件、学习压力的限制,没有这一领域的长辈的帮助,无力承担网络社区的上线运营维护工作,没有对这一模型进行实际完整的检验。
网络社区是社会的一个缩影,社会是人与人之间复杂的关系结构,而基于互联网的网络社区是一个虚拟的社会,它更多的遵从每一个人的意愿形成人际关系,人际关系又是一个极其复杂的。我们只是以一个中学生的眼光进行研究,本身就存在着心智、经验上的局限性。
目前中国的社会结构在发生着巨大的改变,我们这一代将面临长辈多子辈多的生存状态,或许未来我们会更加焦虑,或许我们会无心再经营网络上的人际关系,或许我们会选择在互联网中获取一份安宁。现在还火热的大型网络社区是否能够适应新的局面,我们此次建立的社区模型是否是未来的趋势,这些仍然是个问题,需要得到时间的检验。

网络社区与 Theta 发展的展望

相对于整个互联网行业,网络社区的改变并不大,但随着人工智能的发展普及,用户数据收集与用户隐私保护的矛盾的解决,政府对互联网产品用户协议的规范,未来的网络社区必定更加符合人们的需要。
Theta 是完全依照本课题中的模型建立的网络社区,我们将本课题的延伸寄托于 Theta 的上线运营。在结束高中生活后,我们将会继续 Theta 的实现与改进。未来我们将在计算机领域进行更加深入的学习研究,我们也将长期支持 Theta 服务器的运营,通过邀请朋友的方式增加 Theta 的用户,在聚集起完整的团队后开始谋划公开上线。

活动的感受

这一课题是围绕着网络社区开展的,但在研究的过程中,令我们感触最深的就是当前的互联网环境并不是表面上那么稳定。网络设备是十分脆弱的,它们依赖于各种既定的协议互相通讯,这之中很小的一个错误就可能引发严重的后果。
我们也发现,在网络中保护自己的数据是十分困难的,虽然各种加密协议能够保护自己的数据安全的在网络上传输,但这些数据在服务器、客户端会被解码,这些设备一旦被他人植入木马,就可能将解码后的明文数据盗取。
不仅如此,我们往往会在无意之间在网络社区中发布各种个人信息、生活动态,这些数据被服务商长期存储,而且大都是公开的。如果有人通过自动化程序进行整理,甚至通过人工智能算法进行大规模分析,将会合法地获得大量的丰富的个人信息。
我们也期望,大家可以通过其他方面的努力,使身份证号、银行卡号等这些不可避免的需要上传到网络上的信息不再是秘密、不再能为诈骗或者其他非法行为提供便利。这样,我们也就不必时时刻刻忧心自己的信息安全问题了。

参考文献

  1. Thomas H. Cormen … [et al. 算法导论[M]. 机械工业出版社, 2013.
  2. NicholasC.Zakas. JavaScript 高级程序设计[M]. 人民邮电出版社, 2012.
  3. 王维虎 宫婷. 网页设计与开发[M]. 人民邮电出版社, 2014.
  4. 刘增杰 张工厂. PHP 7 从入门到精通[M]. 清华大学出版社, 2017.
  5. 程朝斌 张水波. MySQL 数据库管理与开发实践教程[M]. 清华大学出版社, 2016.
  6. 陈祥琳. CentOS Linux 系统运维[M]. 清华大学出版社, 2016.

设计稿