原型制作和设计测试
1)为什么需要它
原型是一种快速的解决方案模型,用于在昂贵的实现之前验证假设。测试是收集证据,证明该决定是可以理解、可行和宝贵的。周期目标:- 假设→原型→测试→洞察力→迭代→解决方案。
2)富达级别以及何时选择
低保真(草图/纸张):结构和流量;30-90分钟迭代。
Mid-fi(点击框架):导航,文本,状态;0.5-2天。
高保真(视觉/动画):感知,微互动;1-5天。
Code-proto(互连+真实数据):性能,可用性,复杂模式(KYC,付款);2-10天。
规则:从最低限度的足够水平开始,以回答假设的问题。
3)原型格式
纸/Wireflow:快速脚本,屏幕漫画。
Clicable (Figma/Framer/ProtoPie):过渡、条件分支、伪形式。
奥兹的向导:"幕后的魔法",复杂的逻辑被研究人员模仿。
代码原型(React/Flutter):手势,表演,A11y,与API集成。
内容原型:文本、空白状态、错误/成功。
4)在哪里测试以及如何
通过节制:- 可调解:深度,澄清问题,think-aloud。
- 不可调制:速度,规模,简单任务。
- 远程:地理范围更广,屏幕录制/视频通话。
- 面对面:上下文、眼睛跟踪/手势、物理设备。
- 可用性测试(任务脚本)。
- 认知步行。
- 启发式评估(Nielsen 10)。
- 卡排序/树测试(导航)。
- 5秒测试(第一印象)。
- 偏好测试(屏幕/样式选项)。
- 易受性测试(emo卡)。
- 日记研究(长周期)。
5)测试计划(模板)
1.目的:我们测试什么假设(例如:"新的KYC流将时间到验证减少30%)"。
2.任务场景:4-6关键,具有成功标准。
3.工件:参照原型/版本。
4.指标:任务成功,任务时间,错误,SEQ(1-7),SUS(会话后),UMUX-Lite。
5.新兵:个人资料,市场,N(每个周期5-8名受访者)。
6.程序:介绍→热身→任务→调查→简报。
7.安全和道德:记录同意,不收集个人数据/付款。
8.物流:设备/浏览器,插槽网格,主持人支票清单。
6)一组指标和规范
任务成功率(%):关键步骤的目标比率为≥80%。
任务时间:脚本中位数(与控制比较)。
错误率:严重错误/次要错误的发生率。
SUS: ≥68是基本规范,≥80很棒。
SEQ(1-7):评估任务的复杂性(目标-≤3)。
脚本后的NPS/CSAT:根据需要。
行为信号:吸纳,回归,回归,愤怒的点击。
7)招聘和采样
谁叫:真实细分市场(初学者/经验丰富,地区/语言,设备)。
多少:质量周期为5-8;A/B-统计(见下文)。
筛选:切断专业测试人员,需要相关任务的经验(例如在线支付)。
动机:诚实,不扭曲行为(不为负责任的游戏测试支付产品奖金)。
8)主持人脚本(conspect)
问候,目标: "我们测试设计而不是你。"
记录同意,隐私。
热身:以前的经验,类似物。
挑战:"想象你想要什么……"(最小制导)。
中立的主张: "告诉我们你期待看到什么","什么令人尴尬?"
完成:简短的调查,感谢。
9)发现的分析和优先级
问题分类法:导航、理解、输入、反馈、等待/时间、安全、本地化/A11u。
严重性:Blocker/Major/Minor/Cosmetic。
频率:有多少受访者发生冲突。
对业务的影响:转换,合规风险(KUS/付款),处理。
优先级=严重性×频率×影响。
报告(1页):目标,样本,关键洞察力(5-7),引用示例,瞬间视频链接,解决方案和任务所有者。
10) A/B和实验
测试内容:显然是一个因素(CTA文本、步骤顺序、字段格式)。
度量标准:步骤/漏斗转换、CTR、时间、错误率、取消。
样本大小:根据所需的效果计算(例如,uplift 5-10%,power 80%,α=5%)。
伦理和风险:对于付款/结算,最大限度地减少危害:金丝雀发射,交通量下降,取消。
多变量测试-仅在大量情况下。
11)工具包和文物
原型:Figma/Framer/ProtoPie;代码为React/Next。
记录和分析:屏幕/摄像头,热卡,会议重播,事件。
模板:测试计划,主持人脚本,同意书,清单,单页报告模板,决策日志。
数据:虚构/非个人化,付款存根和KYC。
12)测试中的可用性(A11y)和本地化
我们检查导航禁忌,焦环,"aria-live"吐司/错误。
浅色/深色主题中的AA对比。
"长语言"测试(DE/TR),日期/货币格式,RTL。
发声的错误/成功文本,替代图标。
13)关键流量的细节(iGaming)
注册/CUS:需求易懂,照片提示,ETA("长达2分钟"),文件错误。
付款/存款/提取:限额,佣金,时限,标准规则;拒绝文本;确认步骤。
奖金/任务:透明条件,进步,状态;避免黑暗模式。
负责任的游戏:中性音调,轻松设置限制,访问帮助。
14)转让给开发(handoff)和设计QA
手持套件:原型+规格(状态、动画、令牌)、微拷贝文本、i18n键、A11y要求。
单一定义(UX): 覆盖加载/empty/error/success状态、焦点/键盘、本地化。
设计QA:与布局比较,交互式,对比度/焦点,文本,设备/浏览器上的旋转。
15)支票单
测试前
- 假设和研究问题已经提出。
- 富达级别对应于任务。
- 方桉和成功标准已经准备就绪。
- 新兵和插槽得到确认,同意书已经准备就绪。
- 原型在目标设备/浏览器上打开。
- 敏感行动的存根(付款/CUS)。
测试后
- 收集了Conspects和Timcods。
- 问题按严重程度和频率标记。
- 决定已确定,业主已指定。
- 更新了决策日志和路线图。
- 编写了一份简短的报告(1页)和演示视频(≤5分钟)。
16)反模式
测试"美丽"而不是脚本和任务。
在一个测试中混合多个假设。
在用户尝试之前给出引人注目的问题/线索。
只显示"快乐的道路"-没有错误/空状态。
忽略A11u/"生产前"本地化。
未经确认就1-2名受访者得出结论。
进行A/B而不计算采样功率。
17)快速模式
假设:- "如果我们选择第一步付款方式,那么存款转换将增加7%,因为我们稍后会减少意想不到的限制。"
- "使用银行卡充值500 UAH帐户。"
- "用户无需帮助即可在≤90秒内完成补货。"
- "完成任务有多困难?"(1-非常容易……7-非常困难)
- Blocker:卡住了,无法完成Major →:严重阻碍了Minor的→:减慢了Cosmetic的→:没有干扰。
18)最终的spargalka
从低保真开始,只有在必要时才能提升富达。
测试脚本而不是屏幕。
Мерь Task Success/Time/Errors + SEQ/SUS.
优先考虑严重性×频率×影响。
支持每个周期的A11y和本地化。
记录解决方案并传达详尽的手法。