原型制作和设计测试

1）为什么需要它

原型是一种快速的解决方案模型，用于在昂贵的实现之前验证假设。测试是收集证据，证明该决定是可以理解、可行和宝贵的。周期目标：

假设→原型→测试→洞察力→迭代→解决方案。

2）富达级别以及何时选择

低保真（草图/纸张）：结构和流量；30-90分钟迭代。
Mid-fi（点击框架）：导航，文本，状态；0.5-2天。
高保真（视觉/动画）：感知，微互动；1-5天。
Code-proto（互连+真实数据）：性能，可用性，复杂模式（KYC，付款）；2-10天。

规则：从最低限度的足够水平开始，以回答假设的问题。

3）原型格式

纸/Wireflow：快速脚本，屏幕漫画。
Clicable （Figma/Framer/ProtoPie）：过渡、条件分支、伪形式。
奥兹的向导："幕后的魔法"，复杂的逻辑被研究人员模仿。
代码原型（React/Flutter）：手势，表演，A11y，与API集成。
内容原型：文本、空白状态、错误/成功。

4）在哪里测试以及如何

通过节制：

可调解：深度，澄清问题，think-aloud。
不可调制：速度，规模，简单任务。

按格式：

远程：地理范围更广，屏幕录制/视频通话。
面对面：上下文、眼睛跟踪/手势、物理设备。

方法：

可用性测试（任务脚本）。
认知步行。
启发式评估（Nielsen 10）。
卡排序/树测试（导航）。
5秒测试（第一印象）。
偏好测试（屏幕/样式选项）。
易受性测试（emo卡）。
日记研究（长周期）。

5）测试计划（模板）

1.目的：我们测试什么假设（例如："新的KYC流将时间到验证减少30％）"。
2.任务场景：4-6关键,具有成功标准。
3.工件：参照原型/版本。
4.指标：任务成功，任务时间，错误，SEQ（1-7），SUS（会话后），UMUX-Lite。
5.新兵：个人资料，市场，N（每个周期5-8名受访者）。
6.程序：介绍→热身→任务→调查→简报。
7.安全和道德：记录同意，不收集个人数据/付款。
8.物流：设备/浏览器，插槽网格，主持人支票清单。

6）一组指标和规范

任务成功率（%）：关键步骤的目标比率为≥80%。
任务时间：脚本中位数（与控制比较）。
错误率：严重错误/次要错误的发生率。
SUS： ≥68是基本规范，≥80很棒。
SEQ（1-7）：评估任务的复杂性（目标-≤3）。
脚本后的NPS/CSAT：根据需要。
行为信号：吸纳，回归，回归，愤怒的点击。

7）招聘和采样

谁叫：真实细分市场（初学者/经验丰富,地区/语言,设备）。
多少：质量周期为5-8；A/B-统计（见下文）。
筛选：切断专业测试人员，需要相关任务的经验（例如在线支付）。
动机：诚实，不扭曲行为（不为负责任的游戏测试支付产品奖金）。

8）主持人脚本（conspect）

问候，目标： "我们测试设计而不是你。"

记录同意，隐私。
热身：以前的经验，类似物。
挑战："想象你想要什么……"（最小制导）。

中立的主张： "告诉我们你期待看到什么"，"什么令人尴尬？"

完成：简短的调查，感谢。

9）发现的分析和优先级

问题分类法：导航、理解、输入、反馈、等待/时间、安全、本地化/A11u。
严重性：Blocker/Major/Minor/Cosmetic。
频率：有多少受访者发生冲突。
对业务的影响：转换，合规风险（KUS/付款），处理。
优先级=严重性×频率×影响。

报告（1页）：目标，样本，关键洞察力（5-7），引用示例，瞬间视频链接，解决方案和任务所有者。

10） A/B和实验

测试内容：显然是一个因素（CTA文本、步骤顺序、字段格式）。
度量标准：步骤/漏斗转换、CTR、时间、错误率、取消。
样本大小：根据所需的效果计算（例如，uplift 5-10％，power 80％，α=5％）。
伦理和风险：对于付款/结算，最大限度地减少危害：金丝雀发射，交通量下降，取消。
多变量测试-仅在大量情况下。

11）工具包和文物

原型：Figma/Framer/ProtoPie；代码为React/Next。
记录和分析：屏幕/摄像头,热卡,会议重播,事件。
模板：测试计划,主持人脚本,同意书,清单,单页报告模板,决策日志。
数据：虚构/非个人化，付款存根和KYC。

12）测试中的可用性（A11y）和本地化

我们检查导航禁忌，焦环，"aria-live"吐司/错误。
浅色/深色主题中的AA对比。
"长语言"测试（DE/TR），日期/货币格式，RTL。
发声的错误/成功文本，替代图标。

13）关键流量的细节（iGaming）

14）转让给开发（handoff）和设计QA

手持套件：原型+规格（状态、动画、令牌）、微拷贝文本、i18n键、A11y要求。
单一定义（UX）：覆盖加载/empty/error/success状态、焦点/键盘、本地化。
设计QA：与布局比较，交互式，对比度/焦点，文本，设备/浏览器上的旋转。

15）支票单

测试前

假设和研究问题已经提出。
富达级别对应于任务。
方桉和成功标准已经准备就绪。
新兵和插槽得到确认，同意书已经准备就绪。
原型在目标设备/浏览器上打开。
敏感行动的存根（付款/CUS）。

测试后

收集了Conspects和Timcods。
问题按严重程度和频率标记。
决定已确定，业主已指定。
更新了决策日志和路线图。
编写了一份简短的报告（1页）和演示视频（≤5分钟）。

16）反模式

测试"美丽"而不是脚本和任务。
在一个测试中混合多个假设。
在用户尝试之前给出引人注目的问题/线索。
只显示"快乐的道路"-没有错误/空状态。
忽略A11u/"生产前"本地化。
未经确认就1-2名受访者得出结论。
进行A/B而不计算采样功率。

17）快速模式

假设：

"如果我们选择第一步付款方式，那么存款转换将增加7%，因为我们稍后会减少意想不到的限制。"

测试的任务是：

"使用银行卡充值500 UAH帐户。"

成功标准：

"用户无需帮助即可在≤90秒内完成补货。"

SEQ问题（任务后）：

"完成任务有多困难？"（1-非常容易……7-非常困难）

严重性标题：

Blocker：卡住了，无法完成Major →：严重阻碍了Minor的→：减慢了Cosmetic的→：没有干扰。

18）最终的spargalka

从低保真开始，只有在必要时才能提升富达。
测试脚本而不是屏幕。

Мерь Task Success/Time/Errors + SEQ/SUS.

优先考虑严重性×频率×影响。
支持每个周期的A11y和本地化。
记录解决方案并传达详尽的手法。

原型制作和设计测试

测试后

联系我们

快速联系

视频即将更新

我们目前正忙于各项项目