Method Article
本文介绍了开发基于智能手机的创新饮食评估应用程序 Traqq的协议,包括专家评估和可用性测试。
为了快速可靠地收集饮食摄入数据,开发了一款名为 Traqq 的灵活创新的智能手机应用程序(应用程序)(iOS/Android)。此应用程序可以用作食品记录和 24 小时召回(或更短的召回期)。在这两种方法的预定时间内,可以在预先指定或随机的天/时间创建不同的取样方案,并发出推送通知,敦促参与者登记其食物摄入量。在未响应的情况下,通知会自动重新安排,以确保完整的数据收集。要用作食物记录,受访者可以访问应用程序并全天记录其食物摄入量。食物记录在一天结束时自动关闭;在提交消耗物品后关闭召回。召回以及食品记录模块提供了基于荷兰食品成分数据库 (FCDB) 的广泛食品列表,该数据库可以习惯于满足不同的研究目的。在选择食品时,受访者同时被提示插入份量大小, 即在家庭测量(例如,杯子、勺子、眼镜)、标准份量(例如,小、中、大)或重量(克数)以及用餐场合/消费时间。部分大小选项可以调整, 例如,只有在称量食物记录或消费时间(而不是进食场合)的情况下,才输入克数。该应用程序还包括一个 我的菜功能 ,它允许受访者创建自己的食谱或产品组合(例如,每日早餐),只报告总消费量。随后,应用程序会考虑收益和保留因素。数据存储在安全服务器上。如果需要,可以纳入其他问题, 即一般或与特定食品或用餐场合有关的问题。本文描述了系统(应用程序和后端)的发展,包括专家评估和可用性测试。
准确的饮食评估对于确保营养在健康和疾病预防中的作用的研究质量至关重要。目前,此类研究通常使用既定的自我报告饮食评估方法,即食物频率问卷、24小时召回(24hRs)和/或食品记录1。尽管这些方法对营养研究具有重大意义,但它们也具有各种缺点,例如与记忆有关的偏见、社会可取性偏见,对被调查者和研究人员来说都是沉重的负担。最近的技术发明现在提供了克服这些缺点的机会。在过去的几年里,各研究小组抓住这一机遇,开发了基于网络和基于智能手机的营养研究饮食评估工具,解决了其中一些已知的缺点(见Eldridge等人,对基于网络和智能手机的工具进行了广泛的概述),即减少错误的原因,提高用户友好性,并减轻参与者和研究人员的负担1。
然而,适合营养研究的全自动和经过验证的智能手机应用程序(应用程序)的数量仍然有限。大多数可用的饮食评估应用程序(即商业或开发的研究)要么不是完全自动化(即需要食品的手工编码),要么不是(好)验证3。此外,大多数可用的经过验证的应用程序都是为了一个特定的研究目的而开发的,并在特定国家/地区使用:由于相当固定的设计,重复使用这样的应用程序用于其他研究目的或在其他国家似乎具有挑战性的3,4,5,6,7,8。最后,尽管有基于食品记录的应用程序,但到目前为止,似乎还没有基于召回的应用程序存在。虽然食物记录容易产生反应偏差,即受访者可能会因为意识到他们正在被观察到2、9而改变食物摄入量,但召回的情况并非如此,这强调了开发基于召回的验证应用程序10的必要性。一种名为Traqq的创新饮食评估应用程序在荷兰开发使用,可以用作食品记录和召回,这取决于研究问题1。
除了在食物记录选项和召回选项之间交替的可能性,这个程序也不同于其他饮食评估工具,因为它的灵活性性质。具体来说,关于食品清单、份量估计、抽样方案以及纳入其他问题的可能性。系统的灵活性水平使定制适合多个研究目的,需要准确评估饮食行为。目前,该应用程序正在验证过程中,将准备用于各种类型的营养相关研究。该应用程序也可以使用,也许进一步改善使用,在营养干预计划,以测量和影响饮食行为。由于开发可靠的饮食评估工具是具有挑战性的,而且关于这些过程的报告很少,特别是在用户和专家参与3,11,12方面,本文提供了关于不同信息源如何整合到基于智能手机的膳食评估应用程序的系统和迭代开发的详细概述。该过程包括理论、专家咨询和用户参与。
注:包括人类参与者在内的所有程序都是通过主要定性研究方法以非侵入性的方式进行的。在评估开始前,所有参与者都获得了知情同意。本协议描述了迭次发展过程,大致可分为四个阶段,其中阶段1-3交织在一起(图1)。
图1:应用程序迭次开发过程的概述。 开发过程共分五个阶段。然而,这个过程是反复的,这意味着第1阶段到第3阶段是交织在一起的。 请单击此处查看此图的较大版本。
1. 进行广泛的形成性研究,为实际发展过程做准备。
2. 设计饮食评估应用程序
3. 研究人员的评价
注:每次升级后,营养科学家和研究营养师对应用程序进行了测试,他们拥有饮食评估(内部测试)方面的专业知识,以验证功能是否如预期的那样得到改善。以下说明将由研究人员执行。
4. 使用后端系统进行应用和学习管理
注:系统具有三个授权级别:(1) 管理员- 此授权级别提供对后端所有部分的访问权限(即创建新用户、确定用户授权和授予用户访问一个或多个项目):(2) 项目经理-这一授权级别允许访问特定项目和创建新项目的可能性:和 (3) 研究人员 - 此授权级别仅提供访问研究人员参与的特定项目。
5. 参与者在研究期间使用该应用程序
系统(应用程序和后端)是使用上述协议中概述的步骤开发的;此过程的关键结果如下所述,最后以应用程序的最终设计结束。
形成性研究
除了广泛的文献回顾外,还检查了一些基于网络的工具(例如,康普吃13、ASA2414、食品书2415、MyFood2416),检查了饮食评估方法和实施特征。此外,还比较了荷兰经常使用的几个食品跟踪应用程序的性能(例如,MijnEetmeter17、MyFitnessPal18、Virtuagym Food19),重点是饮食评估方法、信息提供、可靠性、搜索引擎以及其他功能的使用(例如图像、条形码扫描仪、配方功能)。这次检查的结果导致决定开发应用程序的方式,它可以用作食品记录和召回。此外,它导致实施我的菜功能,可用于创建原始食谱或经常消费的产品组合(例如,每天的早餐)。在此功能中,自动考虑产量和保留因素。
要准确量化食物和营养摄入量,一份完整但实用的食物清单至关重要。编制这样的食品清单需要在食品清单的广度和食品的可搜索性(即食品描述需要清晰、易于理解和易于定位)之间权衡。由于食物成分数据是21、22日膳食评估的基本依据,因此确保已开发的食物清单能够与准确的食物成分数据挂钩非常重要。该应用程序中包含的食品列表基于荷兰 FCDB (NEVO)14,该列表因其可靠性和丰富的食品成分数据而入选。最初,NEVO 由 2,389 种食品(2016/5.0 版本)组成,通过消除"混淆项目"(例如, 不能生食用的食物、不能不添加的食物)或不必要包括的物品(例如,由于荷兰食品消费调查(DNFCS)43的低消费率)。
此外,NEVO 含有具有不同品牌名称的类似食品;在这种情况下,只有通用选项包含在食品列表中。为了进一步促进可用性,一些食品被改名,以消除不必要的术语,如"准备"、"冷冻"、"平均"和"自然"。这个"清洁协议"是由三个训练有素的研究营养师开发的,并通过语法执行,一旦NEVO更新,就可以重新运行。此外,为了优化食品的可搜索性,在食品清单中增加了1,019个知名食品的同义词。因此,应用程序中包含的食物列表最终包含 2,468 个项目。 图2显示食物清单发展的概述。需要注意的是,虽然这个广泛的食品清单已经开发为一般用途,应用程序的后端确实允许进口替代食品列表,如果需要的话。
图2:为应用程序开发的食物列表的结构。 食品清单基于荷兰食品成分数据库 (FCDB),并在最终食品列表中为每个项目添加了相应的份量建议和同义词。 请单击此处查看此图的较大版本。
饮食评估的另一个关键方面是份量的量化。虽然份量估计辅助工具(PSEAs),例如图像、参考对象和标准份量,支持报告所消费的食物数量24、26、44,但误报份量仍然是偏见的一个重大来源,24、25、45、46和关于不同PCA有效性的文献不一致26。食品图像、份量建议(即标准尺寸和家庭测量)以及以克为单位的重量自由进入是网络和智能手机饮食评估工具中使用最多的 PSEA34。例如,当部分大小建议(例如,杯子,勺子,小,大)用于工具,如康普吃13和牛津WebQ47,图像帮助部分大小估计的工具,如ASA2414和Myfood2416。为了调查最合适的 PSEA 应用程序,进行了一项试点研究,以比较部分大小建议的准确性(例如,小、中、大或杯子、勺子)、克自由进入和部分大小图像。这项研究的结果导致实施部分大小的建议,作为PCAS在应用程序中,以及选择输入金额在克27。
专家评审
专家评估的目的是从功能和学习方便性方面对应用程序进行定性评估。由于许多用户更喜欢通过探索来学习软件,因此系统的学习能力很重要。共有10名专家,即4名(研究)营养师和6名营养与健康行为专家(科学家)参与了认知演练,其中60%的人使用Android智能手机。最重要的是,专家评估表明,该应用程序的第一个版本不够直观,例如,菜单结构判断不清楚,由于模糊的按钮/图标,搜索引擎产生了一个不合逻辑的结果顺序。专家审查产生的另一个关键点涉及选定的项目无法修改的事实。基于这些结果,应用程序的设计从第 2 阶段开始进行了大幅升级(图 1)。
可用性评估
共有22名参与者参加了思想访谈,这是可用性评估的基础。初始样本量设定为20名参与者36人,之后对数据饱和度进行了评估。由于在20次访谈后没有达到数据饱和度,因此在连续每次访谈后评估数据饱和度时继续纳入。参与者的平均±标准偏差年龄为48±17岁(范围为22-70岁):36%为男性,大多数人口受过高等教育(55%)。此外,大多数参与者都使用 Android 设备(n=14,64%),几乎所有参与者都有超过 1 年的智能手机使用经验(n=21,96%)(表 1)。所有参与者在没有或用最少的指令完成任务。
总计(n=22) | |
性 | |
男性(%) | 36.4 |
女性 (%) | 63.6 |
平均年龄(平均,SD) | 48.1 (17.2) |
教育水平 | |
低 (%) | 0 |
中等(%) | 45.5 |
高 (%) | 54.5 |
智能手机类型 | |
安卓系统 (%) | 63.6 |
iOS (%) | 36.4 |
智能手机体验 | |
短于 6 个月 (%) | 4.5 |
6个月至1年(%) | 0 |
超过 1 年 (%) | 95.5 |
苏斯 (平均, Sd) | 79.4 (15.1) |
表1。研究人群的特点和可用性评价的结果。 只有系统可用性量表 (SUS) 的结果与参与者特征一起在此表中描述。
而一些参与者(n=13,59%)表示在使用"我的菜"功能时有困难;其他(n=5,23%)遇到一些小功能问题,如菜单按钮响应缓慢,以及难以使用与小型智能手机屏幕尺寸不足相关的按钮。此外,15(68%)的参与者表示,他们更喜欢选择输入以克为单位的消费份量。最后,对 SUS 分数的评估显示评分为 79/100(范围 40-100),其中 22 名参与者中只有 3 人将应用评级为低于 68/100,13 名参与者的评分为 80/100 >,这表明该应用可以被视为用户友好型。因此,总体而言,建议的改进不大,可用性评估很有希望。随后,研究团队内部讨论了改进建议,如果认为相关,则纳入第 4 阶段升级,以进一步优化应用程序的可爱性和可用性(图 1)。
最终设计
协议中描述的步骤和评估研究的结果最终导致了应用程序和后端的最终设计,旨在实现简单的视觉设计。此应用程序可以用作食品记录和召回。如前所述,食品列表是 NEVO 的修改版本。份量估计由食物特定份量建议支持;消耗的部分也可以输入克。如果应用的召回版本,研究人员可以选择不同的时隙(例如2hR、8hR 或 24hR)。为了收集不同日期和时间的食物摄入数据,可以在预定的周期内创建各种取样方案。推送通知邀请受访者记录其食物摄入量。为确保完整的数据收集,请柬在未响应时会自动重新安排。在召回模块中,受访者只能在收到邀请后报告其食物摄入量。如果有食物记录,受访者可以访问应用程序并全天记录食物摄入量。
与大多数 24hR 工具相比,应用程序的召回模块并非基于自动多通方法(收集以前 24 小时48年的食品摄入数据的五步法),因为此方法过于复杂且耗时,不适合在应用中使用。更具体地说,为了增加可用性,提高食物摄入记录的合规性,11、38、49,导航被减少到最低限度,将需要访问的屏幕数量限制在4(图3):1)显示报告窗口的概述屏幕:2) 消耗的食物项目通过搜索屏幕报告,一旦选择所需的项目 3) 对话框显示探测进食场合和消费量,之后 4) 用户返回概述屏幕,现在显示录制的食品。此外,用户还可以使用"我的菜"功能创建食谱或产品组合,这些食谱或产品组合可以通过菜单按钮输入。
图3:应用程序中路由的示意图概述。请单击此处查看此图的较大版本。
数据存储在安全服务器上。如果需要,可以纳入额外的问题-一般或与特定的饮食场合或食品有关-可以纳入。该应用程序可以与在线调查工具连接。因此,有可能在预先指定的时间(例如上下文、行为、情绪问题)通过应用程序进行与食物摄入量无关的调查。也可以询问与报告的食品或饮食场合有关的具体问题(例如,当苹果被报告时,当午餐被报告时)。使用在线调查工具提供了通过应用程序提出许多不同问题的机会。收集的食品摄入数据可以从服务器导出并导入营养计算软件进行进一步分析。如果使用其他问题,这些数据将照常在调查工具中提供。其目的是开发结构良好、易于使用的应用程序。设计的一些截图可以在图4A-E中看到。
图4: 应用程序最终版本的截图。 (A)开始/概述屏幕,显示邀请与(在这种情况下)2小时召回期。用户可以按产品托沃根(即添加项目)报告食品项目或格德龙肯的涅茨格格滕(即,我没有吃或喝任何东西),以防在此期间没有消耗任何东西。(B)搜索屏幕,显示与食物列表中的搜索词"Jus"匹配的结果。可从搜索结果中选择所需的项目。(C) 弹出式屏幕需要输入所选项目"Jus d'橙色"的详细信息。在这种情况下,应用程序要求消耗和饮食场合的量。用户可以通过按Annuleren(即取消)或Opslaan(即保存)来返回搜索结果以更进一步。(D) 再次概述,这次显示所有报告的项目。另一个项目可以添加(产品托沃根)或输入可以发送(利斯特弗斯特伦)。(E) 在选择Lijst versturen后,会出现一个弹出窗口,询问用户是否确定要发送,并提醒用户在列表发送后无法进行任何更改。用户可以选择取消 (年纳雷伦) 或发送 (弗斯特伦)。请单击此处查看此图的较大版本。
本文介绍了基于智能手机的饮食评估应用程序Traqq的迭次发展过程。平衡所需的准确性和用户友好性水平,在开发与 1) 数据输入决策相关的应用程序时面临以下主要挑战(即选择最准确的食物识别和份量量化方法)、2) 食物成分数据(即选择准确的数据库并创建完整的食物列表)、3) 自定义选项(即, 食品清单、份量量化和食谱的灵活性),以及4)验证(即根据传统方法和/或独立措施)3,50。在文献审查期间,确定了5个经过验证和全自动化的,基于智能手机的,为研究开发的饮食评估工具3,即我的膳食伴侣4,电子饮食摄入量评估(eDIA)7,轻松饮食日记8,电子卡内特阿里门泰尔(e-CA)5,和饮食和轨道(EaT)6。
由于这五个饮食评估应用程序以及这个应用程序的自动化水平,研究人员的负担和成本大大降低,而数据完整性增加相比,传统的饮食评估方法。此外,该应用程序,反过来,不同于现有的五个饮食评估工具的灵活性。具体来说,虽然现有的应用程序都基于食物记录方法,但此应用程序可以用作食物记录和召回。此外,虽然这些应用程序的设计是固定的,Traqq有主要的优势,它可以修改,以适应不同的研究目的(如饮食评估方法,食物清单,抽样方案,附加问题)3,50。相反,其他现有的饮食评估应用程序包含有价值的功能,这些功能尚未在应用中实现(尚未实施)。为了说明这一点,一些应用程序允许用户拍摄他们的食物的照片,以获得食物识别和份量估计,如半自动,技术辅助的饮食评估(TADA)系统51,52。
可用性研究的参与者还表示,使用照片可能是辅助部分大小估计的宝贵补充。然而,在现阶段实施这种功能仍有许多挑战需要解决,例如,具体说明和指导摄影角度(即评估深度)、需要参考制作者(即纠正大小和颜色)、照片前后必不可少的(即评估消耗量), 以及如何处理食谱菜肴。由于这些技术挑战,现有的基于图像的饮食评估应用程序仍然是半自动化的,这意味着手动图像审查必须由用户,研究人员,或两者51,52。技术进步,如众包和机器学习,有可能改善使用食物图像的饮食评估53,54。将来,这些选项将探讨,以进一步改善应用程序。应用的发展过程以各种关键步骤为特征。首先,完成了一个形成性的研究步骤,其中科学概念作为应用创建基础的科学概念,有助于决策建立应用程序的总体轮廓。
在这一阶段,特别注意FCDB的选择和PSEA方面的选择,这两个方面都直接影响到数据的准确性21。关于FCDB,由于该应用程序最初是在荷兰开发使用的,其食品清单是基于荷兰FCDB,NEVO14。将来,目标是进一步开发用于国际的应用程序,这需要更广泛的食物成分数据,因为许多食品是针对国家的。目前,还没有国际 FCDB 存在,如果存在,其使用可能有限。更具体地说,由于荷兰食品清单中已经包含2,389个食品项目,因此,为5个国家实施国际食品成分表可能会使食品数量增加约5种,从而对食品的可搜索性以及应用程序的可用性产生负面影响。因此,针对具体国家的食品清单可能是最有价值的,而且往往也受到专业人士的青睐。
这得益于应用程序,因为它允许进口替代食品清单,从而与不同的(国际)食品成分表连接。关于份量,有多种选项可用于支持估计的准确性,例如,使用图像小册子、参考对象和/或文本部分大小建议26。鉴于用户友好性,在应用中直接实现 PSEA 比在应用旁边使用 PSEA(例如图像手册、参考对象)更可取。在开发应用程序期间,决定通过提供使用份量建议输入部分大小建议和以克为单位输入部分大小的机会,从而促进份量量化。份量大小建议是基于唯一可用的荷兰份量数据库56。虽然荷兰的饮食评估工具,如康普吃和Eetmeter也依赖于这个数据库13,17,需要注意的是,这个部分大小数据库可以追溯到2003年,餐具大小已经增加了57。因此,使用此数据库可能低估了食物摄入量。
目前,部分大小数据库正在由荷兰国家公共卫生与环境研究所(RIVM)、荷兰营养中心和瓦格宁根大学和58研究所更新,最终将用于更新应用程序中的份量建议。新旧部分之间的差异将在需要时进行映射和调整。虽然使用部分大小图像(即一系列图像描绘不同数量的选定食物)可能是一个很好的替代文本部分大小建议59,研究表明,部分大小估计的准确性是最高的,当一系列部分大小的图像同时呈现,而不是一个图像一次45, 60,61。一般来说,目前可用的智能手机屏幕相对较小,这限制了一系列图像的呈现。虽然新技术有助于使用交互式部分大小图形,其中虚拟盘子或杯子上的食物量可以通过使用滑块61来增加或减少,但这些技术相对较新,仍需要彻底评估以评估其准确性。
开发该应用程序的另一个关键步骤包括专家和预期最终用户的参与。虽然不经常纳入工具(或未描述)11,12的发展过程,从专家的反馈,以及预期的最终用户-是关键的61,允许最大限度地利用,并保持所需的准确性水平。预期最终用户的反馈在"我的菜"功能的最终设计中特别有帮助。总的来说,用户对创建自己的菜肴的可能性感到满意。但是,他们确实在处理某些程序时举步维艰,例如,尽管该功能会自动保存数据,但用户看不到这些数据。因此,许多用户不断搜索保存按钮,并卡住了,害怕回去,失去了他们的输入。基于这些反馈,功能得到了改进,以更好地满足用户的期望。
总之 ,Traqq 是一款创新的应用程序,与现有应用和基于 Web 的工具相比具有许多优势。但是,仍然存在各种限制。由于应用程序仍然依赖于自我报告,自报告相关的测量错误仍然存在(例如,记忆偏差(即在回忆的情况下),社会可取性偏差,和食物摄入量修改(即,在食物记录的情况下),不准确的部分大小估计(即,在两者中)1。在未来几年中,将探索最近推出的新技术,以进一步推进应用程序, 例如,通过探索实现功能的价值,如条形码扫描仪,录音,聊天机器人和图像,这可以改善食品识别和份量估计。也正在探讨与其他应用程序(如活动跟踪器、睡眠跟踪器)和设备(如加速度计、心率监测器、咀嚼传感器)连接的可能性。最后,后端也正在受到进一步发展,例如,通过扩大抽样选项。
作者没有什么可透露的。
作者要感谢阿努克·吉伦和阿文德·达迪安在特拉克的发展中发挥的关键作用。此外,作者还要感谢罗米·威廉森在数据收集和可用性研究中的数据分析方面给予的帮助。最后,作者要感谢专家和参与者在整个过程中分享他们的经验和意见。该开发项目由瓦格宁根大学和研究公司执行,部分资金来自农业、自然和食品质量和工业部,在TKI农业与食品PPS项目(智能食品摄入量(AF16096)的背景下。
Name | Company | Catalog Number | Comments |
ASA24 Portion size picture book | American National Cancer Institute | na | The portion size image database as used in the ASA24-tool |
Atlas.ti v8 | ATLAS.ti Scientific Software Development GmbH | na | Qualitative data analysis software for research |
Compl-eat | Wageningen University | na | The portion size suggestions database as used in the Compl-eat 24hR module |
iOS screen record function | Apple Inc. | na | Build-in iOS feature to make screen recordings |
NEVO (version 2016/5.0) | RIVM | na | Dutch Food Composition Database |
Qualtrics | Qualtrics XM | na | Online survey tool that can be used to implement additional questions in Traqq |
Recordable | Invisibility ltd. | na | Android app to make screen recordings |
SPSS version 24.0 | IBM Corporation | na | Statistical software |
System Usability Scale (SUS) | na | na | Validated questionnaire to assess a system's usability |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。